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概念 

。 Unix 系统 包含 用 户 程 序 和 系统 内 核 

* 内 核 由 多 个 子 系统 构 成 

。 内 核 管 理 所 有 的 程序 和 资源 

， 进程 之 间 的 通信 对 Unix 程序 是 很 重要 的 
”什么 是 系统 编程 

相关 命令 

* be 


^ more 


1.1 jr 24 


什么 是 系统 编程 ?什么 是 Unix 系统 编程 ”本 书 具体 会 涉及 哪些 知识 ? 本 章 力 图 回答 
上 述 问题 。 

首先 从 分 析 操 作 系 统 的 职责 入 手 . 米 解释 如 何 编 写 与 操作 系统 紧密 相关 的 程序 。 然 后 
通过 分 析 标 准 的 Unix 命令 ,以 及 它们 用 到 的 系统 调用 ,进一步 指导 读者 自己 编程 实现 相应 
的 功能 .这 一 章 的 最 后 会 通过 一 幅 图 来 描述 Unix 系统 。 本 书 的 主要 学 习 形 式 就 是 通过 图 
示 和 齐 析 文中 程序 所 涉及 的 命令 .技术 ,进而 实现 系统 编程 。 


1.2 什么 是 系统 编程 


1.2.1 简单 的 程序 模型 


你 可 能 写 过 各 种 各 样 的 程序 ,有 科学 计算 方面 的 .金融 方面 的 .图 像 方面 的 .文字 处 理 方 
面 的 等 。 大 部 分 的 程序 都 是 基于 以 下 模型 ,如 图 1.1 所 示 。 





计算 机 


图 11 计算 机 中 的 程序 
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在 这 个 模型 中 .程序 就 是 可 以 在 计算 机 上 运行 的 一 如 代码 ,程序 把 输入 数据 做 相应 处 理 
后 给 出。 例如 用 户 在 键盘 上 输 和 人 数据, 然后 在 屏幕 得 到 输出 。 程 序 可 能 对 磁盘 进行 操作 ,还 
可 能 会 用 到 打印 负 。 
遵循 上 述 模型 ,看 以 下 代码 ， 
/* copy from stdin to stdout »/ 
mata) 
{ 
int c; 
while( ( c = getcbar() ) !» EOF ) 
putchar(c); 
} 


这 段 代码 对 应 图 1}.2 所 示 的 模型 。 


putchar ( ) 


getchar ( ) 





图 1.2. 程序 的 输 人 1 输出 


在 图 1. 2 中 键 盐 和 显示 器 与 程序 直接 相连 。 在 简单 的 个 人 计算 机 中 ,实际 情况 是 很 类 似 
的 ,键盘 和 显示 卡 直 接连 到 计算 机 的 主板 上 ,CPU 和 内 存 也 是 通过 插 梢 直接 连 在 主板 上 , 它 
们 通过 主板 上 的 印刷 线路 , 连 为 一 体 。 如 果 能 够 打开 机 箱 ,所 看 到 的 大 致 如 此 。 


1.2.2 系统 模型 
如 果 所 使 用 的 系统 是 一 个 多 用 户 系统 ,如 典型 的 Unix 系统 , 那 会 是 一 副 怎 样 的 情形 呢 ? 








Als £THP. RFRA 
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刚才 的 简单 模型 已 经 不 适用 ,图 1. 3 会 更 接近 一 些 。 

在 这 个 系统 中 有 多 个 用 户 同时 运行 多 个 程序 ,可 能 需要 访问 多 个 设备 。 

虽然 昼 型 复杂 了 ,但 对 程序 而 育 , 它 还 是 从 键盘 得 到 数据 ,将 结果 显示 在 显示 器 上 ,也 可 
以 对 磁盘 读 写 ,这些 损 作 都 设 有 任何 问题 , 它 使 用 的 还 是 简单 模型 。 

接 下 来 考虑 一 种 更 为 复杂 的 情况 ,有 许多 键盘 /显示 器 , 它们 可 以 随意 好 连接 到 不 同 的 
程序 ,随意 地 操作 它们 ,这 种 情况 如 图 1.4 所 示 。 





图 1.4 fest n] DL BE SK RUE BERRY 


实际 上 .在 计算 机 内 部 ,这 种 随意 的 连接 是 不 允许 的 ,必须 采用 一 种 机 制 进行 管理 ， 
1.2.3 操作 系统 的 职责 


计算 册 用 操作 系统 来 管理 所 有 的 资源 ,并 将 不 同 的 设备 和 不 同 的 程序 连接 起 来 。 从 连 
著 的 角度 来 讲 , 损 作 系统 的 作用 就 像 主板 上 的 印刷 线路 一 样 ， 
有 了 操作 系统 以 后 ,图 1. 4 的 混乱 状态 就 可 以 得 到 改变 ,新 的 模型 如 图 1.5 所 示 ，。 








FR Pg [ar 


四 1.5 操作 系统 是 一 个 畦 殊 的 程序 


操作 系统 也 是 程序 ,与 普通 程序 一 样 .也 运行 在 内 存 中 ,同时 它 又 是 一 个 特殊 的 程序 , 它 
能 把 普通 程序 与 其 他 程序 或 设备 连接 起 来 。 
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1.2.4 为 程序 提供 服务 


现在 的 问题 (系统 中 的 多 个 用 户 和 程序 是 如 何 连 楼 起 来 的 ) 和 大 至 的 解决 办 法 ( 道 过 一 
个 管理 程序 ) 已 经 很 清楚 了 , 接 下 来 看 具体 的 解决 方案 。 

首先 要 解释 一 些 术 语 , 内 存 空 间 用 来 存放 程序 和 数据 ,就 像 古雅 典 人 腾 出 空间 来 放 衣 服 
一 样 ,所 有 的 程序 都 必须 在 内 存 空 间 中 才能 运行 ,用 米 容纳 操作 系统 的 内 存 空间 叫做 系统 空 
[8] ,容纳 应 用 程序 的 内 存 空间 叫做 用 户 空间 ， 

操作 系统 也 钙 称 为 内 核 , 有 了 内 核 的 概念 后 ,再 来 看 计算 机 系统 的 连接 情况 ,如 图 1.6 
PR AR . 





All.6 内 核 答 理 计算 机 系统 的 连接 


注意 ,在 图 1.6 中 可 以 发 现 ,程序 要 访问 设备 (如 键盘 、 磁 肯 各 打印机) 必须 通过 内 核 , 所 
以 只 有 内 核 才 能 直接 管理 设备 。 

程序 如 果 要 从 键盘 得 到 数 饮 ,必须 向 内 核发 出 请 求 . 若 亦 显示 器 上 显示 结果 ,也 要 通过 
内 核 ,程序 中 所 有 对 设备 的 操作 都 是 通过 内 核 进 行 的 。 

图 1.6 中 的 线 是 内 核 提供 的 虚拟 连接 线 ,内 核 向 程序 提供 服务 以 便 程序 能 够 访问 到 设备 。 

解释 了 这 些 内 容 后 ,再 来 看 什么 是 系统 编程 。 编 写 普 通 程序 时 可 以 认为 .程序 是 直接 连 
到 键盘 .显示 器 .磁盘 等 设备 的 ,但 在 进行 系统 编程 时 ,必须 对 系统 的 结构 和 工作 方式 有 更 深 
的 了 解 , 要 知道 内 核 提 供 哪些 服务 (系统 调用 ) ,如 何 使 用 它们 ,系统 有 哪些 资源 和 设备 ,不同 
的 资源 和 设备 该 如 何 操作 。 


1.3 理解 系统 编程 


内 核 提供 服务 以 便 系统 程序 可 以 直接 访问 系统 资源 ;那么 有 哪些 系统 资源 和 服务 呢 ? 
1.3.1 系统 资源 


1、 处 理 器 (Processor) 
程序 是 由 指令 构成 的 ,处 理 器 是 执行 指令 的 硬件 设备 .一 个 系统 中 可 能 有 党 个 处 理 器 。 
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内 核能 够 安排 一 个 程序 何 时 开始 执行 , 何 时 暂时 停止 PR A iT EA. 

2 输入 给 出 CI” 0) 

程序 中 所 有 输入 /输出 的 数据 、 终 端的 输入 /输出 数据 还 有 硬盘 输 人 /输出 数据 ,者 必须 
VL Et EE ,这 种 集中 的 处 理 方式 有 以 下 优点 : 正确 性 ,数据 流 不 会 流 错 地 方 有 效 性 ,程序 员 
无 需 考 虑 不 同 设备 之 问 的 差异 ; 安全 性 ,数据 信息 不 会 被 未 被 授权 的 程序 非法 访问 。 

3. 进程 管理 (Process Management) 

进程 指 程序 的 一 次 运行 ,每 个 进程 都 有 自己 的 资源 ,如 内 存 , 打 开 的 文件 和 其 他 运行 时 
所 需 的 系统 资源 。 内 核 巾 与 进 积 相关 的 服务 有 新 建 一 个 进程 .中止 进程 .进程 调度 等 。 

4. A (Memory) 

内 存 是 计算 所 系统 中 很 重要 的 资源 ,程序 必须 被 装 裁 到 内 存 中 才 可 以 运行 。 内 核 的 职 
责 之 一 是 内 存 管理 ,在 需要 的 时 和 候 给 程序 分 陀 内 存 , 当 程序 不 需要 的 时 候 回 收 内 存 , 内 核 还 
能 够 保证 内 存 不 被 其 他 的 进程 非法 访问 。 

5. iE (Device) 

计算 机 系统 中 可 以 有 各 种 各 样 的 外 设 , 如 磁带 机 .光驱 、 鼠 标 .扫描 仪 和 数码 摄像 机 等 ， 
它们 的 操作 方式 各 不 相同 ,内 核能 屏蔽 掉 这 种 差异 ,使 得 对 设备 的 操作 方式 简单 而 统一 。 便 
如 ,一 个 程序 想 要 从 数码 照相 机 中 取出 照片 存储 在 计算 机 中 , 它 只 需 向 内 核 提 出 操作 该 资源 
的 请 求 即 可 。 

6. 计时 器 (Timers) 

程序 的 工作 与 时 间 有 关 , 有 的 需要 定时 被 角 发 ,有 的 需要 等 一 段 时 间 再 开始 某 个 动作 ， 
有 的 需要 知道 某 一 个 换 作 消耗 的 时 间 ,这 些 都 涉及 计时 器 ,内 核 可 以 通过 系统 调用 向 应 用 程 
序 提 供 计 时 器 服务 。 

7. Sb 2 j8 2842 CInterprocess Communication) 

在 现实 生活 中 人 们 通过 电话 、e-mail, 信 件 . 广 播 , 电 视 等 互相 通信 , 存 计 算 机 的 记 界 中 ， 
不 同 的 进程 也 需要 互相 通信 ,内 核 提 供 的 服务 使 进程 间 通 信 成 为 可 能 。 就 像 电 信和 和 邮政 提 
供 的 服务 ,通信 也 是 资源 。 

8. 网 络 (Networking) 

网 络 之 间 的 通信 可 以 看 作 是 进程 间 通 信和 的 特殊 形式 ,通过 网 络 , 不 同 主机 上 的 进程 , 即 
使 使 用 的 是 不 同 操作 系统 ,也 可 以 互相 通信 。 网 络 通信 也 是 内 核 提 供 的 服务 。 


1.3.2 目标 : 理解 系统 编程 


刚才 已 经 简单 介绍 了 内 核 所 提供 的 各 种 类 型 的 服务 ,各 种 内 核 服务 具体 有 什么 特点 ,会 
FH SUBIES E di ,需要 哪些 参数 ,会 提供 万 些 数据 , 接 下 来 的 目标 是 掌握 内 核 服务 的 机 制 ,以 便 
在 自己 的 程序 中 使 用 这 些 服务 。 


1.3.3 方法 : 通过 三 个 问题 来 理解 
本 书 通 过 以 下 3 个 步骤 来 学 习 。 
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1. 分 析 程 序 

首先 分 析 现 有 的 程序 ,了 解 它 的 功能 及 实现 原理 。 

2. 学 习 系 统 调用 

看 程序 都 用 到 格 些 系统 调用 ,以 及 每 个 系统 调用 的 功能 和 使 用 方法 。 
3. 编程 实现 

利用 学 到 的 原理 和 系统 调用 ,自己 编程 实现 原来 程序 所 实现 的 功能 。 
Lik 3 步 可 以 通过 下 面 3 个 问题 来 实现 : 

* 它 能 做 什么 ? 

。 它 是 如 何 实现 的 ? 

* 能 不 能 自己 编写 一 个 ? 


1.4 从 用 户 的 角度 来 理解 Unix 
1.4.1 Unix 能 做 些 什么 


要 学 习 Unix 系统 编程 ,首先 看 看 Unix 能 做 些 什么 。 下 面 从 一 个 从 终端 登录 到 系统 中 
的 普通 用 户 的 角度 来 看 Unix 是 什么 , 它 能 做 些 什么 。 


1.4.2 登录 一 运行 程序 一 注销 


使 用 Unix 的 过 程 一 般 如 下 : 登录 到 系统 中 ,运行 程序 ,工作 结束 后 再 注销 。 登 录 的 时 候 
妆 输 人 用 户 名 和 密码 : 


Linux 1.2.13 (maya) (ttypl) 
maya login: betsy 
Password; | 


登录 到 系统 中 以 后 ,就 可 以 运行 各 种 各 样 的 程序 了 ,比如 收发 邮件 程序 .科学 计算 程序 
以 及 游戏 程序 

运行 程序 也 很 简单 , 当 显示 器 上 出 现 提 示 符 后 (一 般 是 “入 ) ,输入 程序 的 名 字 , 按 回 车 ， 
程序 将 开始 运行 。 运 行 结束 后 ,提示 符 再 次 出 现 。 

图 形 用 户 界 面 的 操作 方式 实际 上 也 是 这 样 的 。 图 标 和 菜单 可 以 看 作 是 提示 符 , 双 击 图 
标 就 像 运 行 命令 一 样 ,系统 会 把 双击 操作 解释 为 相应 程序 的 执行 。 

运行 完 程 序 后 ,可 以 从 系统 中 注销 : 


$ exit 


在 有 些 系统 中 ,可 以 通过 输入 logout MEA AE Ctrl 十 门 来 注销 。 

它 是 如 何 工作 的 呢 ? 

这 看 起 末 很 简单 ,但 系统 在 内 部 是 如 何 处 理 的 呢 ? 

首先 来 看 登录 过 程 。 人 们 常 说 使 用 计算 机 就 像 使 用 自己 的 汽车 一 样 , 这 时 个 人 计算 机 
中 的 概念 ,问题 在 于 Unix 允许 许多 用 户 , 可 能 是 几 十 甚至 几 百 人 ,同时 登录 到 系统 中 ,系统 
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是 如 何 对 这 么 多 的 用 户 进行 管理 的 呢 ? 

在 登录 过 程 中 , 当 用 户 名 和 密码 道 过 验 评 后 ,系统 会 启动 一 个 叫 shell 的 进程 ,然后 把 用 
户 交 给 这 个 进程 .由 这 个 进程 处 理 用 户 的 请 求 。 每 个 用 户 都 有 属于 自己 的 shell 进程 ， 

图 ),7 是 用 户 登 录 到 Unix 系统 中 的 示意 网 。 





Al? 用 户 登录 到 系统 


图 1. 7 中 左边 的 大 盒子 表示 计算 机 系统 , 坐 在 键盘 和 显示 器 前 的 是 用 户 , 计 算 机 里 有 内 
存 , 内 核 运行 在 内 存 中 ,sheli 为 用 户 提 供 服务 ,shell 和 用 户 之 间 的 连接 由 内 核 控制 。 

Shell 在 屏幕 上 显示 出 提示 符 , 表 示 现 在 可 以 接收 用 户 的 输入 。、 对 于 普通 用 户 而 言 担 示 
MORES ,也 可 能 还 会 显示 其 他 的 提示 信息 。 用 户 可 以 在 提示 符 后 输入 要 运行 的 程序 的 
名 字 ,内 核 负 责 把 用 户 的 输入 传 给 shell， 例 如 ,运行 显示 日 期 和 时 间 的 程序 如 下 ， 


$ 
5 date 
Sat Jul 1 21:34:10 EDT 2000 


3 


date 命令 显示 出 月 期 , 接 下 来 显示 命令 提示 符 。 
要 运行 其 他 命令 ,只 要 和 输 人 程序 名 即 可 ,Unix 中 有 一 个 程序 fortune, 下 面 是 它 运行 的 
例子 ， 


$ fortune 
Algol - 60 surely must be regarded as the most important 
programming language yet developed. 
-~ T. Cheatham 
S 


当 用 户 注销 时 .内核 会 结束 所 有 分 配 纵 这 个 用 户 的 进程 ， 
内 核 是 如 何 创 建 shell 进程 的 呢 ? shell 进程 是 如 何 得 到 输入 的 程序 名 ,内 核 又 是 如 何 运 
行程 序 的 呢 ? 登录 系统 和 运行 程序 并 非 想像 的 那么 简单 。 这 些 细节 会 在 第 8 章 讨论 。 
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1.4.3 目录 操作 


用 户 登 录 后 ,可 以 对 白 己 的 文件 进行 操作 。 文 件 中 可 以 有 e-mail、 图片 、 源 程序 .可 执行 
程序 等 各 种 各 样 的 数据 。 文件 被 组 织 在 目 订 中 。 

1， 目 录 树 

在 Unix A St i|, Sc PERI B o ER DLL BUT EE, Unix 提供 相应 的 命令 来 对 目录 进行 
操作 。 

图 1.8 是 一 个 日 录 树 的 例子 。 





图 1.8 日 录 树 的 一 部 分 


如 图 1.8 所 示 ,文件 系统 的 最 巴 端 是 “/”, 它 刀 做 根 虽 录 , 根 旧 录 一 般 都 包含 几 个 于 由 有 隶 。 
AXE Unix KABER A SP HA /etc./home,/bin 等 几 个 子 目录 ,它们 都 有 特定 的 用 
途 , 比 如 大 多 数 的 Unix 用 户 都 有 自己 的 主 且 录 , 而 一 般 来 说 用 户主 目录 就 在 /home 目录 中 。 

Unix 系统 中 有 很 多 命令 都 与 目录 有 关 , 如 新 建 日 永 . 删 除 目录 、 改 变 当 前 目录 、 列 出 目录 
内 容 等 , 读 完 本 节 的 内 容 后 可 以 自己 试 一 试 这 些 命令 ， 

2. ARR S 

(OD ls——#IH BRA 

ls a> BS fF Hide h RRA A. BE 2418 RAC EAI A ABA ls, 那么 列 
出 的 是 当前 日 录 的 内 容 , 如 果 输 人 ls dirname ,那么 列 出 的 是 dirname 所 指定 的 目录 的 内 容 ， 
如 输入 : 


ls fete 


会 列 出 /etc 目录 里 面 所 包含 的 文件 和 子 目 录 , 同 样 地 ,如 果 输 人 |: 


ls 7 


则 会 列 出 根 目录 的 内 容 ， 
(2) ed 改变 当前 目录 








ed 命令 的 作用 是 改变 当前 的 目录 。 当 刚刚 登录 到 系统 中 时 ,当前 上 月 录 是 自己 的 主 且 录 ， 
可 以 通过 cd 命令 转 到 其 他 目录 ,如 : 





ed /bin 


$69 /bin 县 录 下 ,这 个 目录 中 有 很 多 系统 命令 ,可 以 用 1s 查看 有 哪些 命令 。 通 过 下 述 命 令 
转 到 上 一 层 目录 : 


Od 
Ait 24 ii REA ,通过 下 述 命令 都 可 以 立即 回 到 用 户 的 主 目 录 : 


cd 


(3) pwd 一 一 显示 当前 目录 
pwd 命令 告诉 当前 目录 是 什么 , 它 列 出 的 是 全 路 径 , 即 从 根 目录 开始 的 路 径 , 如 : 


$ pwd 


/home/cse215/samples 


从 上 述 操作 可 以 知道 ,当前 目录 是 通过 从 根 目 录 开 始 , 依 次 进 和 人 home, cse215 , samples 
EX IIR 

(4) mkdir, rmdir Bi KR R 

用 mkdir 来 新 建 目 录 , 如 : 





$ od 
$ mkdir jokes 


SHAERSR ESIG TEX HEP SY jokes 这 样 一 个 目录 。 一 般 来 说 ,只 能 在 自己 的 目 
录 中 新 建 目 录 而 不 允许 存 其 他 用 户 的 目录 中 新 建 目 录 。 
要 删除 一 个 已 经 存在 的 目录 ,可 以 用 rmdir 命令 ,如 : 


$ rmdir jokes 


如 果 jokes 和 且 录 是 空 和 目录 , 那 这 个 命令 可 以 把 jokes 删除 。 注 意 用 rmdir SEG ER HG 
须 先 把 吴 录 中 的 文件 和 子 目录 删除 或 移 走 。 

3， 目录 操作 命令 的 工作 原理 

从 刚才 的 分 析 可 以 知道 硬盘 上 的 目录 和 文件 构成 了 一 棵 目录 树 , 树 的 中 间 结 点 是 目录 ， 
每 个 目录 又 可 以 包含 很 多 的 子 目 录 和 文件 ,可 以 新 建 或 删除 目录 ,可 以 从 一 个 目录 转 到 其 他 
MAR. 

然而 这 些 是 如 何 工作 的 呢 ? 首先 来 考察 硬盘 ,硬盘 是 由 很 多 片 金 属 或 玻璃 的 盘 片 组 合 
起 来 构成 的 ,这 些 盘 片上 可 以 保存 磁性 信息 ,问题 是 目录 在 哪里 用户 在 自己 的 主 目录 中 意 
味 着 什么 ? 转 到 其 他 目录 又 意味 着 什么 ? Unix 允许 很 多 用 户 同 时 登录 到 系统 中 ,他 们 可 以 
有 相同 的 当前 目录 ,也 可 以 在 不 同 的 月 录 中 ,会 不 会 因为 很 多 用 户 在 同一 个 目录 中 导致 这 个 
目录 过 分 拥挤 ? 还 有 的 问题 是 ,如 果 要 自己 来 编写 一 个 改变 当前 目录 的 程序 ,该 如 何 来 实 
BL? 内 核 在 这 棵 目录 树 中 扮演 什么 角色 ? 
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1.4.4 文件 操作 


文件 存放 在 目录 中 ,用 户 文件 位 于 用 户 和 白 己 的 主 目录 中 ,系统 文件 位 于 系统 目录 中 。 对 
文件 的 操作 有 哪些 呢 ? 

1. 文件 操作 的 命令 

CL) 文件 命名 规则 

每 个 文件 都 有 文件 各 ,在 大 多 数 的 Unix 系统 中 ,文件 名 最 长 可 以 是 250 个 字符 ,很 多 字 
符 都 可 以 出 现在 文件 名 中 ,如 大 小 写字 符 、 标 点 符号 .空格 ,tab, 其 至 回 车 符 , 伺 是 不 能 包含 根 
BRASS". 

(2) cat, more,less,pg 一 一 查看 文件 的 内 容 

上 述 命令 都 可 以 用 来 查看 文件 的 内 容 , 但 也 有 上 蛙 细微 的 差别 ,cat 一 下 子 列 出 文件 的 所 有 
内 容 : 


§ cat shopping- list 
soap 

cornflakes 

milk 

apples 

jan 


$ 
“MMAR RS E BEA Ba I SERE more 会 更 加 合适 ， 


S8 more longfile 


显示 一 屏 后 会 暂停 输出 ,这 时 用 户 按 空 格 键 ,more SRSA S BE S MOREA UL 
显示 下 一 行 ,输入 "9g” 则 退出 。 另 外 两 个 命令 less 和 pg 的 功能 与 more ERMA. 

(3) cp 文件 复制 

可 以 用 cp 命令 米 复 制 文件 ,如 : 





S cp shopping - list last. week. list 


将 文件 shopping - list 复制 一 份 ,新 的 文件 各 为 last. week. list, 
(4) rm 一 -文件 删除 
删除 文件 的 例子 如 下 : 


$ rm old. data junk shopping. june1992 


— BAN T 3 个 文件 。 

Unix FFA Be RS Be AR PE — fA Je Unix 是 一 个 多 用 户 系统 , 当 一 
个 文件 被 删 掉 以 后 , 它 所 占用 的 存储 空间 可 能 被 立即 分 配给 其 他 用 户 的 文件 ,有 可 能 某 块 磁 
盘 空 间 刚才 还 是 你 的 学 期 论文 ,下 -- 个 时 刻 就 变 成 了 另外 一 个 用 户 的 局 程 序 , 所 以 成 功 依 复 
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f^ PI 8E PETR MK a 
(5) mv -一重 命名 或 移动 文件 
mv áp uf VASE gio PE AS sx at XP n : 


$ mv progl.c first_prograu.c 


将 文件 prog]. c 改名 ,新 的 名 字 是 first program. c. 
也 可 以 移动 文件 , 即 改 变 文 件 的 位 置 ,如 : 


5 mkdir mycode 
$ mv first program.c mycode 


新 建 一 个 目录 mycode, 然 后 将 first program. c 移动 到 这 个 目录 中 。 
(6) lpr. lp 一 一 打印 文件 
用 ipr 来 打印 文件 ,如 ， 


$ lpr filename 


上 述 命 令 把 filename 送 到 默认 的 打印 机 打印 ,很 多 大 型 系统 有 不 止 一 台 的 打印 机 ,可 以 
通过 lor 命令 指定 用 万 一 台 打 印 ,在 有 些 系 统 中 ,可 用 ip 命令 来 完成 tpr 的 工作 ， 

2. 文件 操作 命令 的 工作 原理 

从 用 户 的 角度 来 看 ,文件 是 数据 的 集 食 ,文件 中 的 数据 是 如 何 存储 在 磁盘 上 的 ?文件 是 
如 何 被 复制 的 ? 如 何 移动 和 改名 的 ? 进一步 来 讲 , 文 件 的 名 字 存 放 在 器 里 ? 作为 一 个 系统 
程序 员 ,必须 能 够 同 答 这 些 问题 ,而 这 些 问 题 的 答案 就 在 Unix RAP, 

3. 文件 许可 权限 

系统 中 每 个 用 户 都 有 自己 的 文件 ,出 于 很 多 原因 ,你 不 会 希望 别 的 用 户 能 够 修改 自己 的 
文件 ,甚至 读 也 不 行 。 系 统 中 有 一 些 管理 命令 ,如果 使 用 得 不 好 会 对 系统 造成 损害 ,管理 员 
不 希望 普 道 用 户 也 有 运行 这 些 命 令 的 权力 。 这 些 对 文件 种 命令 宫 作 的 限制 是 如 何 行使 的 呢 ? 

Unix 遂 过 一 些 文件 属性 来 对 文件 和 命令 的 操作 进行 控制 。 每 个 文件 都 有 文件 所 有 者 
(ovwner) 和 文件 许可 权限 。 文 件 所 有 者 指明 了 系统 中 某 -- 个 用 户 , 文 件 的 创建 者 就 是 文件 所 
aa. 

文件 许可 权限 分 为 3 组 ,通过 ls -1 命令 可 以 看 到 ， 





$ ig - 1 outline. 01 
—rwxr-x--- 1 molay users 1064 Jun 29 00:39 outline. 01 


-1 称 为 命令 行 选项 ,选项 -1 使 得 ls 输出 文件 的 详细 信息 。 同 一 个 命令 ,可 以 通过 不 同 
的 选项 ,使 它 所 做 的 工作 稍 有 不 同 。 这 里 的 文件 详细 信息 包含 文件 的 许可 权限 ,文件 所 有 
者 、 文 件 长 度 、 最 后 修改 时 间 等 ,其 中 的 “rwxr - x- "SR X ET AR 

每 个 文件 都 有 文件 所 有 者 和 3 组 许可 权限 ; 
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-rwx rwx TWX r,read, w.write, x,execute 


user group other 


与 3 组 许可 权限 相对 应 ,用户 也 被 分 为 3 组 : uscr; 文 件 所 有 者 ; group;, 与 文件 所 有 者 辐 
组 的 用 户 ; other 其 他 用 户 。 每 组 的 用 户 都 可 以 有 3 种 权限 ; 读 权 限 、 写 权限 和 执行 权限 。 
这 样 针 对 不 同 用 户 - 一 共 是 9 个 权限 ,这 些 权 限 可 以 分 别 设 定 , 如 可 以 指定 其 他 用 广 只 能 烙 改 
文 忻 而 不 能 读 文 件 , 文 件 所 有 者 莽 至 可 以 取消 自己 读 自己 文件 的 权限 。 

4, 交 忻 许可 权限 的 工作 原理 

文件 许可 权限 是 如 何 工 作 的 ? 怎么 来 设置 ? 系统 是 如 何 应 用 刚才 讲 到 的 权限 的 ? 许可 
权限 存放 在 哪里 ? 在 后 续 的 章节 会 对 这 些 问题 做 解答 。 


1.5 从 系统 的 角度 来 看 Unix 


15.1 用 户 和 程序 之 间 的 连接 方式 


前 面 的 小 节 从 用 户 的 角度 来 看 Unix 系统 ,用 户 登 录 到 系统 中 ,运行 程序 ,再 从 系统 中 退 
出 。 与 此 同时 ,可 能 有 很 多 其 他 用 户 也 在 登录 、 运 行程 序 或 退出 系统 ,他 们 可 以 同时 对 一 个 
文件 进行 操作 ,好 像 工作 在 各 和 白 独 立 的 室 间 中 ,他 们 之 间 还 可 以 通过 发 送 e-mail 或 即时 消息 
进行 沟通 。 

其 实 每 个 独立 的 室 间 都 是 系统 的 一 部 分 ,从 宏观 的 角度 来 看 ,系统 还 可 能 由 很 多 的 用 
户 、 很 多 程序 ,甚至 很 多 计算 机 系统 互相 连接 而 成 。 接 下 来 ,将 通过 3 个 例子 来 看 系统 是 如 何 
工作 的 ,如 何 编 程 使 系统 中 的 不 同 部 分 做 到 协 泣 统一。 


1. 5.2 网 络 桥牌 


许多 人 都 二 网 络 轿 牌 这 个 游戏 ,世界 各 地 的 玩家 通过 计算 机 网 络 连接 到 一 起 ,游戏 开始 
以 后 ,参加 者 就 可 以 看 到 一 个 共同 的 牌 泉 ,能 够 看 到 别人 出 的 牌 ,图 1.3 是 一 个 简单 的 说 明 、 








图 1.9 4 个 人 通过 网 络 打 桥牌 


图 1.9 中 有 4 个 人 ,他 们 每 人 都 有 一 台 计 算 机 ,通过 网 络 连 接 在 一 起 。 但 图 1.9 中 还 少 














图 1.10 HEELS 


图 1. 10 中 增加 了 第 5 DRAR «ek RSE TE eK AYR EB, BA Te 
ERER [- AY) A 1) a aa ER AE ROT f FRR 

1k BE AE YP cM AO 8E Mo A MT RO UL HL RAP AE TE P RP e rh HEE ES il XR — A 
出 牌 ? 牌 又 存放 在 哪里 ? 某 个 人 手中 有 几 张 牌 又 意味 着 化 么 ”如 何 来 保证 不 让 两 个 人 有 同 
一 张 牌 ”这 在 现实 生活 中 不 会 有 任何 问题 ,但 在 虚拟 的 网 络 中 确实 要 仔细 考虑 ， 

图 1.11 显示 了 在 网 络 桥牌 中 的 信息 流 ， 





图 1.11 分 布 的 程序 向 其 他 用 户 发 送信 息 


网 络 桥牌 的 例子 展示 了 Unix 系统 编程 中 3 个 重要 的 方面 。 


COD 通信 
某 个 用 户 或 进程 如 何 与 其 他 用 户 或 进程 交换 信息 ? 
(2) 协作 


在 同一 个 时 刻 .网络 桥 牌 的 两 个 用 户 不 会 都 去 合同 一 张 牌 ,程序 如 何 来 协调 多 个 进程 使 
他 们 能 够 没有 冲突 地 访问 共享 资源 ? 

(3) 网 络 访问 

在 这 个 例子 中 ,互相 独立 的 计算 机 通过 网 络 连 接 到 一 起 ,那么 计算 机 中 的 程序 是 如 何 来 
使 用 网 络 的 呢 ? 


1.5.3 be: Unix 的 计算 器 


Unix 系统 中 的 bc 命令 是 执行 一 个 基于 字符 的 计算 器 程序 .bc 有 两 个 重要 的 特点 , 稍 后 
ZWA. ZAAK TAR. RRRA: 





~ 146 Unix/Linux 编程 实践 教程 





$ be 
不 会 有 任何 的 版 本 信息 和 提示 信息 出 现 , 但 这 时 已 经 可 以 接收 输入 了 ,如 ， 


2+3%4t5%10 


be 会 显示 计算 结果 ,而且 它 知 道 先 散 乘 法 再 做 加 法 。 要 退出 bc, 按 Ctrl 十 D f. 
bc 的 一 个 重要 特点 是 , 它 可 以 处 理 很 大 的 整数 ,如 ， 


399959999999999999999 + 80B888888888888888888 
BB8888888888888B8B88711111111111111111112 


为 了 得 到 更 大 的 整数 ,可 以 借助 于 午 运 算 ， 


3333 ^ 44 
10110051584495640993500589840218228579482240528849807070336511X 
1794768438904110649252911543814688907219481422090046883818703X 
5540915541156321905747562427309521 


3333 的 44 次 方 , 得 到 的 整数 足 足 有 现行 壮 那 么 长 ,bc 还 是 可 编程 的 ,可 以 定义 变量 ,有 
逻辑 判断 和 循环 结构 ,语法 与 口语 言 类 做 ,如 ， 


x j] 

if (x == 3)1 
yu x * 3; 
} 

¥ 


bc 的 另 一 个 重要 特点 是 ,从 严格 的 意义 上 讲 , be 并 不 做 任何 计算 。 为 了 说 明 这 一 点 ,做 
如 下 操作 ， 
$ be 
2*3 
5 


7 - press Ctrl- Z here 


Stopped 

$ Ps 

PID TIY S TIME CMD 
25102  ttyp2 T 0:00.02 bc 
27081 ttyp2 (T 0:00.01 de - 
27550 ttyp2 I 0:00.59 - bash 
27681  ttvp2 T 0:00.00 bc 

$ fg 


«i-- press Ctrl - D here 


ps 命令 可 以 列 出 系统 中 运行 的 所 有 进程 ,这 里 一 共有 4 个 进程 ,除了 两 个 bc 外 ,bash 是 
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shell 进程 ,那么 dc 是 什么 ? 
在 大 多 数 的 Unix 系统 中 部 提供 了 联机 帮助 ,可 以 从 那里 得 到 需要 的 信息 , 变 找 关于 de 
的 信息 FUA: 


$ man dc 

User Commands dc(1) 

NAME 
dc - desk calculator 

SYNOPSIS 
dc [ filename 】 

DESCRIPTION 
dc is an arbitrary precision arithmetic package . Ordinarily 
it operates on decimal integers, but one may specify an 
input base, output base, and a number of fractional digits 
to be maintained. The overall structare of dc is a stacking 
(reverse Polish) calculator. If an argument is given, input 
is taken from that file unril its end, then from the standard 


input. 


这 些 信 息 来 自 于 SunOS 5. 8 的 联机 帮助 ,大 多 数 Unix 系统 关于 dc 的 描述 都 是 类 他 的 ， 
它 说 明了 dc 是 一 个 计算 器 , 它 能 够 接收 道 波兰 表达 式 , 算 出 表达 式 的 值 。 逆 波兰 麦 达 式 指 的 
是 操作 数 在 前 ,操作 符 在 后 ,也 称 做 后 缀 表达 式 ,如 要 计算 表达 式 2+ 3 的 值 , 它 所 对 应 的 道 波 
兰 表 达 式 是 23 + ,dc 的 输入/ 和 输出 如 下 ， 


wm "o + 05 N 


内 部 进行 的 操作 是 这 样 的 : 先 将 2 人 栈 , 再 将 3 人 栈 ,然后 将 栈 顶 的 两 个 数 出 栈 ,计算 它 
们 的 和 ,并 将 结果 入 栈 ,p 是 为 了 将 栈 项 元 索 打 印 出 来 。 这 样 可 以 知道 dc 是 一 个 基于 栈 的 计 
算 器 ,那么 be 是 什么 ?de 的 运行 条 件 又 是 如 何 被 满足 的 呢 ? 

读 了 be 的 联机 帮助 就 会 知道 ,bc 是 dc 的 预 处 理 器 , 它 将 用 户 输入 的 表达 式 转换 成 逆 波 
兰 表达 式 , 然 后 通过 一 个 称 为 管道 Cpipe) 的 通信 程序 交 给 dc, 如 图 1.12 PER. 


22+p : 242 





图 1.}2 程序 交换 信息 


用 户 输入 中 统 表 达 式 如 “2 十 2”,be 将 它 转 化 为 相应 的 后 级 表达 式 形式 XA de 执行 ,de 
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计算 表达 式 的 值 ,将 结果 返回 给 be be 再 将 结果 以 合适 的 形式 显示 在 显示 器 上 。 所 以 对 普通 
FAAP MS b 就 是 计算 器 。 

与 网 络 桥牌 类 似 , 计 算 器 也 是 由 不 同 的 程序 互相 协作 构成 一 个 完整 系统 的 ,每 个 程序 有 
各 自 的 功能 ,互相 独立 、 相 互 协作 。Unix 系统 编程 在 很 多 场合 下 ,就 是 要 解决 好 建立 这 些 独 
立 程 序 之 间 的 连接 和 协作 方式 的 问题 。 


1.5.4 从 bc/dc 到 Web 


从 架构 的 角度 来 看 ,万 维 网 (World Wide Web) 5 be/dc 是 十 分 类 似 的 ， 通过 刚才 的 学 
习 可 以 知道 be 负责 用 户 界面 ,de 负责 后 台 运 算 , 在 万 维 网 中 ,浏览 器 负责 有 角 户 界面 .在 后 面 
负责 提供 网 页 的 是 Web 服务 器 ,如 图 1.13 所 示 。 





图 1.13 ”游览 器 和 Web AR 3r 35 38 (8 


用 户 直 接 操作 浏览 器 ,从 浏览 器 上 上 看 到 网 页 的 效果 ,而 网 页 并 不 存放 在 浏览 器 上 ,而 是 
存放 在 Web 服务 器 上 .网 页 由 HTML 语言 写成 ,就 像 dc 的 语法 一 样 ,HTML 不 是 很 容易 理 
解 , 旦 不 直观 。 用 户 端的 工具 一 一 浏览 器 就 像 be 一 样 ,从 服务 器 上 接收 到 信息 后 ,会 把 它 以 
容易 理解 的 形式 直观 地 显示 给 用 户 。 

所 以 说 万 维 网 与 bc/dc 是 类 似 的 ,而 Web 首先 出 现在 Unix 平台 上 也 是 一 件 自然 而 然 的 
Bgm. 


1.6 动手 实践 


前 面 的 部 分 通过 两 个 问题 进行 学 习 , 它 们 是 “ 它 能 做 什么 ?” 和 “ 它 是 如 何 实 现 的 ?” 接 下 
来 应 该 是 第 三 个 问题 了 :“ 能 不 能 自己 编写 一 个 ”。 在 本 节 试 着 自己 编写 一 个 程序 来 实现 
more 的 功能 。 

首先 ,more 能 做 什么 ? 

more 可 以 分 页 显示 文件 的 内 容 ; 大 部 分 的 Unix 系统 都 有 文本 文件 /etcytermcap . 它 经 
常 被 文本 编辑 器 和 游戏 各 序 用 到 ,用 more 来 查看 它 的 内 容 : 


$ more /etc/termcap 
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more 会 显示 文件 第 一 屏 的 内 容 , 在 评 幕 的 底部 ,more 用 反 白字 休 显 示 文 件 的 百分比 ,这 
时 如 果 按 空格 键 ,文件 的 下 一 屏 内 容 会 显示 出 来 ,如 果 按 回 车 键 ,显示 的 则 是 下 一 行 , 如 果 输 
和信“q” ,结束 显示 ,如 果 输 入 “h”, 显 示 出 来 的 是 more 的 联机 帮助 。 

注意 , 当 按 空格 链 或 输入 "gd" 后 BERE E BR IA RE ,而 无 需 再 按 回 车 键 。 

more 有 3 种 用 法 : 








S more filename 
$ command | more 


$ more — filename 


第 一 种 情况 ,more 显示 文件 filename 的 内 容 ; 第 二 种 情况 ,more 将 command 命令 的 输 
出 分 页 显示 ; 第 二 种 情况 ,more 从 标准 输入 获取 要 分 页 显示 的 内 容 , 而 这 时 more 的 标准 输 
入 被 重 定向 到 文件 filename, 

第 二 个 问题 ,more 是 如 和 何 实现 的 ? 

通过 运行 more 并 观察 结果 可 以 知道 ,more 的 工作 流程 如 下 : 


于 一 ~ show 24 lines from input 

| +-—> print [more?] message 

| | Input Enter, SPACE, or q 

| +-- if Enter, advance one line 
T---—-.. Xf SPACE 


if q -—» exit 


接 下 来 要 编写 的 程序 应 该 像 实际 的 more 一 样 , 有 足够 的 灵活 性 ,也 就 是 说 ,如 果 在 命令 
行 中 给 出 了 文件 名 ,那么 就 分 页 显示 这 个 文件 ,否则 的 话 , 从 标准 输入 得 到 要 分 页 显示 的 内 
容 。 下 面 是 more 的 第 一 个 版 本 : 


jx more0l.c - version 0.1 of more 
* read and print 24 lines then pause for a few special commands 
x/ 

# include «stdio.h— 

# define PAGELEN 24 

tt define LINELEN 512 

void do more(FILE x); 

int see more(); 

int main( int ac, char *av[|) 

1 

FILE * fp; 





if (ac == 1) 
de_more(stdin) - 
else 
while ( -- ac) 
if ( (fp = fopen( * ++av "r" )) I= NULL ) 
{ 
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do more( fp; 
fclose( fp); 
} 
else 
exit(l); 
return Q; 
} 
void do more( FILE « fp) 


it 


; 


* read PAGELEN lines, then call see more() for further instructions 


* i 


{ 
char line[ LINELEN |， 
int num_of_lines = 0; 
int see more(), reply; 
while ( fgets( line, LINELEN, fp) )4 
if ( num of lines == PAGELEN ) ! 
reply = see more(); 


if ( reply == D) 


break; 
num of lines 一 = reply; 
t 
if ( fputs( line, stdout ) == EQF } 
exit(1); 


num of lines ++ ; 


r 


} 


int see more() 


" 


j* 


/* more input x/^/ 
fx full screen? #/ 
/* y, ask user x^ 


/* n: done #/ 
/* reset count */ 
fx show line «/ 


i or die »/ 


/* count it x»/ 


x print message, wait for response, return # of lines to advance 


* q means no, space means yes, CR means one line 


* f 
1 
int c; 
printf("\033[ 7m more? X033| m5; 
while( (c = gétchar()) |= EGF ) 
{ 
if g == 'q') 
return 0; 
if (Cc == '') 
return PAGELEN; 
if (e == Mn') 


return 1; 


/* reverse on a vt100 +’ 


/* get response */ 
fe q Ns 
fx tot => next page x/ 


/* how many to show x^ 


/* Enter key =>> 1 line »/ 
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return 0; 


} 

XBR A 3 个 函数 ,在 主 函 数 中 判断 应 该 从 文件 还 是 标准 输入 中 获取 数据 ,并 打开 相 
应 的 数据 源 ,然后 调用 do more 函数 ,do_more 将 数据 显示 在 显示 器 上 , 满 一 屏 后 ,调用 see 
more 函数 接收 用 户 的 输入, 以 决定 下 一 步 的 动作 。 编 译 并 运行 上 述 代 码 : 

$ cc moreOl.c - o moreO1 

$ morel more01.c 

这 个 程序 可 以 完成 基本 的 功能 ,显示 了 24 行 后 就 停 下 来 等 待 输 入 ,而 自在 屏幕 下 方 会 有 
反 白 的 提示 [more?|, 当 按 回 车 键 后 会 显示 下 一 行 。 

fH & [n] BREEN. SRR RS LRN, more? SHS LR. KHER RSA 
AY. Wit AS Re zs d RE e AC qn Jr s RAE REIT ABA SIR. 

PERF A EAB (RD CT f] PMS. AARP SR SC; Unix 编程 不 是 很 
难 , 但 也 不 是 轻而易举 的 事情 。 

这 个 程序 的 目标 很 清晰 ,实现 算法 也 不 复杂 ,但 是 除了 算法 ,还 有 其 他 问题 需要 考虑 ， 

接 下 来 有 这 样 一 些 问题 , 如 何 使 得 不 用 回 车 ,程序 就 得 到 输入 ? 如 何 计算 显示 的 百 分 
tb? 如 何 去 掉 反 白 的 |more?|? 

先 来 看 对 数据 源 的 处 理 , 在 main 函数 中 检查 命令 参数 的 个 数 ,如 果 没 有 参数 , 那 就 从 标 
准 输入 读 取 数据 ,这 样 一 来 more 就 可 以 通过 管道 重 定 向 来 得 到 数据 ,如 : 








S who | more 


who 命令 列 出 当前 系统 中 活动 的 用 户 ED “| who 的 输出 重 定向 到 more 的 输 
A ER TERK Bas 24 个 用 户 后 暂停 ,在 有 很 多 用 户 的 情况 下 ,用 more 来 对 who 的 输出 进 
行 分 页 就 会 很 有 必要 ， 

接 下 来 是 输入 重 定向 的 问题 ,看 以 上 例子 : 


$ ls /bin more0l 


期 望 的 结果 是 将 /bin 目录 下 的 文件 分 页 ,显示 24 行 以 后 暂停 。 

然而 实际 的 运行 结 打 并 不 是 这 样 的 ,24 行 以 后 并 没有 暂停 而 是 继续 输出 ,问题 在 哪 
Hu? 

24 more01 EE ALAS 24 后 , 它 打 印 了 |more?j ,然后 等 待 用 户 的 输入 。 

用 户 的 输入 是 从 哪里 来 的 ”在 moreo1 中 用 getchar O , 它 是 从 标准 输入 读数 据 的 ,问题 
就 在 这 里 。 刚 才 的 命令 : 


$ ls ‘bin | more0i 


已 经 将 more01 的 标准 输入 重 定向 到 ls 的 标准 和 输出, 这样 more01 将 从 同一 个 数据 流 中 读 用 
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户 的 输入 .这 显然 有 问题 ,图 1.14 描述 了 这 种 状况 。 





1.]4 more 从 标准 输入 读数 据 


解决 这 个 问题 的 方法 是 ,从 标准 输入 中 恋人 要 分 页 的 数据 ,直接 从 键盘 该 用 户 的 输 人 ， 
如 图 1.15 Fim. 





B] 1.15 more JA &£ / ALP BRA 


Bj 1. 15 中 有 一 个 文件 /dev/ity, 这 是 键盘 和 显示 器 的 设备 描述 文件 .向 这 个 文件 写 相 当 
于 显示 在 用 户 的 屏幕 上 . 读 相 当 于 从 键盘 获取 用 户 的 输入 。 即 使 程序 的 给 入 /输出 被 "二 "或 
“>” 重 定向 ,程序 还 是 可 以 通过 这 个 文件 与 终 疾 交 沪 数据 。 

从 图 1. 15 中 可 以 知道 ,more 有 两 个 输入 ,程序 的 标准 输入 是 ls 的 输出 .将 其 分 页 显示 
到 屏幕 上 , 当 more 种 要 用 户 输入 时 , 它 可 以 从 /dev/tty 得 到 数据 。 

运用 上 述 知 坦 改进 more01. c. 得 到 more02, c. 


/# more02.c - version 0.2 of more 

* read and print 24 lines then pause for a fev special commands 
x feature of version 0. 2; reads fron /dev/tty for commands 
x / 

# include <stdio.h> 

# define PAGELEN 24 

4 define LINELEN 512 

void do_more(FILE ~ ); 

int see_more(FILE *); 

int main( int ac, char »av[] ) 

{ 

FILE *fp; 
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} 


ifCac == 1) 

do more( stdin ); 
else 

while ( 一 一 ac ) 


if ( (fp - fopen( * + tav, "r" )) |= NULL) 
í 

do more( fp }; 

fclose( fp; 
i 


else 
exit(1); 


return 0, 


void do more( FILE x fp 3 
fx 


* read PAGELEN lines, then call see_more() for further instructions 


x 


{ 


char line| LINELEN | ; 

int num of lines - 0; 

int see more(FILE *), reply; 
FILE * fp tty; 

fp tty = fopen( "/dev/tty", "r" ); 


/* NEW; cmd stream «/ 


if ( fp tty == NULL) 


exit(15; 


while ( fgets( line, LINELEN, fp ) | 
if ( num of lines == PAGELEN ) | 
reply = see more(fp tty); 
if ( reply == 03 


break ; 
num of lines -= reply; 
? 
if ( fputs( line, stdout ) == EOF 》 
exit(1); 


num of lines ++ ; 


} 


int see more(FILE x cmd) 
fn 


/* if open fails */ 

/* no use in running */ 
/* more input */ 

/* full screen? x/ 

/* NEW, pass FILE « w/ 


/* n: done x/ 
/* reset count */ 
/* show line x/ 


/* or die «/ 


/* count it «/ 


/* NEW. accepts arg */ 


* print message, wait for response, return # of lines to advance 


* q Means no, space means yes, CR means one line 


*/ 
{ 


int €; 


» 2] * 


> 22 « Unix/Linux 编程 实践 教程 





Printf("\033[7m more? N033[n'5; /* reverse on a vt100 »/ 
while (c= getc(cmd)) ! = EOF) /* NEW. reads from tty »/ 
{ 
ifle == 'q') aq -> Nr/ 
return 0; 
if (c == |!) /5 ' * => next page r 
return PAGELEN; /* how many to show »/ 
if (c == 'An') /x Enter key => 1 line #/ 
return 1; 
} 
return 0; 


} 
编译 并 测试 新 的 程序 : 


S cc - o more02 nore02.c 


$ 1s /bin | more02 


more02.c 可 以 从 标准 输入 得 到 数据 ,也 可 以 从 键盘 得 到 用 户 的 得 人 ,同时 通过 编写 
more02.c, 增 加 了 对 文件 /dev/tty 的 了 解 。 

more02. c 还 需要 进一步 完善 , 当 用 户 按 空 格 键 或 簿 人“q" 后 ,还 得 按 回 牢 键 ,程序 才 会 3 
作 , 而 且 输 入 的 字符 会 显示 出 来 。 实 际 的 more 是 不 需要 额外 的 回 车 的 ,而 且 答 人 的 字符 也 
不 会 回 显 。 

3， 对 输入 的 进一步 处 理 

用 户 操 作 的 终端 有 很 多 参数 ,可 以 调整 参数 使 得 用 户 输 入 的 字符 被 立即 送 到 程序 ,而 不 
用 等 待 回 车 ,还 可 以 使 输入 的 字符 不 回 显 ,如 图 1. 16 Bron. 





图 1. 1]6 SiiS x REST a 


图 1.16 中 新 加 入 部 分 是 用 于 调整 终端 参数 的 ,程序 运行 的 时 候 可 以 动态 地 调整 终端 的 
参数 。 
要 编写 一 个 完善 的 more 还 有 很 多 工作 要 做 ,以 下 是 留 给 污 者 的 问题 。 如 和 何 知道 文件 中 
已 显示 的 言 分 比 ? 要 知道 百分比 就 必须 知道 文件 的 大 小 .这 些 信息 操作 系统 是 提供 的 .需要 
用 合适 的 系统 调用 来 得 到 。 如 何 反 自 显示 文字 ? 如 何 确定 每 一 页 的 行 数 ?这些 都 跟 终 端 类 
型 有 关 ,如 果 将 每 一 页 定 为 24 行 ,终端 类 型 定 为 vt100, 那 么 程序 就 缺乏 足够 的 灵活 性 。 如 
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何 使 程序 能 够 处 理 各 种 类 型 的 终端 ? 那 就 需要 学 习 如 何 控制 和 调整 终端 参数 的 知识 。 
1.7 工作 步 又 与 概要 图 


1.7.1 接 下 来 的 工作 步 又 


Unix 系统 是 一 个 多 用 户 系统 , 它 允 许 很 多 用 户 很 多 程序 同时 工作 ,程序 经 常 对 文件 、 目 
录 进 行 换 作 .对 数据 进行 转换 或 传输 。 同 一 台 机 器 上 的 不 同 程序 之 间 , 基 至 不 同 机 器 上 程序 
之 问 通 过 网 络 都 可 以 互相 通信 ， 

这 么 多 复杂 的 程序 ,它们 的 功能 是 什么 ?是 如 何 工 作 的 ?在 中 间 操 作 系 统 做 了 些 什么 ? 
随 着 学 习 的 桨 人 ,这 些 问题 会 越 来 越 多 地 钙 解 答 。 

在 研究 more 的 过 程 中 展示 了 解决 问题 的 步 又 .首先 分 析 一 个 实际 存在 的 程序 SRE 
的 功能 ,分 析 它 的 实现 原理 ,然后 自己 编写 一 个 。 通 过 对 程序 的 不 断 完 善 来 更 多 地 了 解 Unix 
系统 和 它 的 工作 了 原 再。 这 也 是 本 书 采 用 的 主要 方法 。 


1.7.2 Unix 的 概要 国 


Unix 的 结构 如 图 1.17 Bra. 





图 1.17 Unix 系统 的 主要 结构 


图 1. 17 描述 了 Unix 系统 的 主要 结构 ;内存 被 分 为 系统 空间 和 用 户 空间 ,内 核 和 它 的 数 
据 结 构 位 于 系统 空间 ,用户 程序 位 于 用 户 空间 ,用 户 通 过 终端 连接 到 系统 ,文件 存放 在 磁盘 
上 ,各 种 各 样 的 设备 被 内 核 直 接管 理 , 用 户 程序 可 以 通过 内 核 来 访问 设备 ,最 后 还 有 网 络 连 
接 ,用 户 可 以 通过 网 络 接 人 系统 。 

接 下 来 的 每 章 都 会 关注 系统 的 某 一 个 部 分 .介绍 相关 的 系统 调用 逻辑 和 数据 结构 。 学 
完 本 书后 ,会 对 图 1. 17 中 每 一 个 部 分 表 有 所 了 解 ,应 该 能 够 编写 一 般 的 Unix 系统 程序 ,如 
网 络 桥牌 。 
1.7.3 Unix HRADE 

这 本 书 的 主要 内 容 是 介绍 Unix 的 系统 结构 和 相关 概念 ,以 及 如 何 编 写 Unix 程序 ,你 可 
会 问 .Unix 从 哪里 来 ? 它 是 怎么 发 展 的 ? 在 这 里 简要 地 介绍 Unix 的 发 展 历程 。 

1969 年 ,贝尔 实验 室 的 计算 机 科学 家 发 明了 Unix ,最初 的 Unix 是 由 内 核 和 一 些 工 具 组 
成 的 , 它 并 不 是 一 个 商业 产品 ,实际 上 在 20 世纪 70 年 代 ; 由 尔 实验 室 向 大 学 和 研究 机 构 提 供 
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Unix, 包 括 完 整 的 源 代 码 , 仅 收取 象征 忻 的 费用 。 贝 尔 实验 室 以 及 其 他 的 计算 机 科学 家 不 断 
地 改进 Unix。 到 1980 年 ,一 些 公 司 发 布 了 商用 的 Unix, 这 时 的 Unix 主要 分 为 两 个 系列 ,一 
TE AT&T ATA System V, 另 一 个 是 加利福尼亚 大 学 伯 开 利 分 校 的 BSD, 大 多 数 的 Unix 
都 源 自 上 述 两 个 Unix 版 本 。 几 年 后 ,伯克利 停止 了 BSD 的 研究 ,System V 则 被 销售 给 了 其 
他 公司 。 

Unix 在 商业 计算 各 研究 机 构 得 到 很 大 的 发 展 ; 出 现 了 不 同 的 方向 ,如 有 些 Unix 的 实时 
性 就 很 出 众 。 虽然 各 种 Unix 不 尽 相 同 , 但 Unix 的 核心 架构 和 其 主要 系统 调用 却 可 以 保持 
稳定 ,1980 年 AT& T ff) Unix 5 1991 年 在 赫尔辛基 诞生 的 Unix 会 有 很 大 不 局, 但 1980 年 
编写 的 Unix 程序 稍 加 修改 就 可 以 在 1991 年 的 Unix 上 运行 。 

那么 什么 是 Unix Ub? 只 要 有 与 这 些 版 本 类 似 的 结构 和 运行 特性 ,提供 应 有 的 系统 服 
务 , 那 就 是 Unix, ATARI} Unix 的 不 断 发 展 , 现 在 有 些 系统 看 起 来 很 像 Unix. 但 在 
代码 里 却 看 不 到 System V 或 USB 的 影子 ,如 GNU/Linux, POSIX 标准 中 用 形式 化 的 方法 
RRT Unix 的 系统 接口 ,但 是 要 了 解 Unix, 单 单一 个 标准 是 不 够 的 。 

Unix 有 很 长 的 发 展 历史 和 不 同 的 版 本 ,所 以 ,一 本 尿 所 能 涵盖 的 是 十 分 有 限 的 。 本 书 只 
描述 了 不 同 的 Unix 共有 的 原理 .技术 和 结构 , 备 个 不 同 版 本 的 Unix 的 特点 并 不 在 本 书 介绍 
的 范畴 内 。 

你 可 能 工作 在 SunOS 上 ,也 可 能 在 ATX 或 其 他 的 Unix 平 台 上 ,关于 特定 平台 的 知识 可 
以 参考 所 使 用 平台 的 联机 帮助 ,实际 上 对 本 书 的 学习 很 大 程度 上 要 借助 联机 帮助 ， 

要 是 注意 的 话 就 会 发 现 , 有 时 候 一 项 功能 可 以 用 不 同 的 函数 来 实现 ,这 有 两 个 原因 。 一 
是 Unix 是 由 不 同 的 机 构 完 善 的 .如 AT&T 和 BSD, 对 于 同一 个 要 解决 的 问题 ,他 们 采用 了 
不 同 的 函数 名 来 实现 。 另 一 个 原因 是 Unix 自身 的 发 展 需要 兼容 , 当 有 一 个 新 的 服务 可 以 赫 
代 老 的 服务 时 ,人 们 并 不 会 把 老 的 系统 调用 去 掉 , 而 是 增加 新 的 系统 调用 ,这 就 使 以 前 编写 
的 程序 也 可 以 顺利 地 运行 。 在 本 书 中 也 有 这 样 的 情况 ,可 以 用 不 同 的 兽 数 来 做 同一 件 事 情 ， 
作为 系统 程序 员 ,这 是 经 常 的 和 不 可 避免 的 。 


小 结 


计算 机 系统 中 包含 了 很 多 系统 资源 ,如 硬盘 ,内 存 、 外 国 设备 ,网 络 连 接 等 ,程序 利用 
这 些 资 源 来 对 数据 进行 存储 、 转 换 和 和 处理。 

多 用 户 系统 需要 一 个 中 央 管 理 程序 ,Unix 的 内 核 就 是 这 样 的 程序 , 它 可 以 对 程序 和 
资源 进行 管理 。 

: 用 户 程 谨 要 访问 设备 必须 经 过 内 核 。 

一 些 Unix 的 系统 功能 是 由 多 个 程序 的 协作 而 实现 的 ， 

要 编写 系统 程序 ,必须 对 系统 调用 和 相关 的 数据 结构 有 深入 的 理解 。 
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概念 与 技巧 

。 联机 帮助 的 作用 与 使 用 方法 

^ Unix 的 文件 操作 函数 : open. read, write , seek close 
。 文件 的 建立 与 读 写 

。 FREF 

。 缓冲 : 用 户 级 的 缓冲 与 内 核 级 的 缓冲 

。 内 核 模式 APERAR AAAA 

© Unix 表示 时 间 的 方法 与 时 间 格 式 问 的 转换 
* 4&8 Bi utrmp 文件 来 列 出 已 登录 的 用 户 

。 系统 调用 中 的 错误 检测 与 处 理 
相关 的 系统 调用 

* Dpen ,read write.creat.|lseek .close 

* perror 

相关 命令 

* man 

* who 

* cp 

* login 
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在 使 用 Unix 的 时 候 , 经 常 需 要 知道 有 哪些 用 户 正在 使 用 系统 ,系统 是 否 很 繁忙 , 某 人 是 
否 正 在 使 用 系统 等 。 为 了 回答 这 些 问 题 ,可 以 使 用 who 命令 ,所 有 的 多 用 户 系统 都会 有 这 个 
命令 。 这 个 命令 会 显示 系统 中 活动 用 户 的 情况 。 接 下 来 的 问题 是 , who 命令 是 如 何 工作 
的 呢 ? 
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术 间 分析 Unix 中 的 who 命令 ,通过 分 析 来 学 习 Unix 的 文件 操作 。 除 此 之 外 ,还 将 学 习 
如 何 从 Unix 的 联机 天 助 中 得 公有 用 的 信息 ， 


2,2 关于 命令 who 


下 而 给 出 了 Unix 系统 的 概览 图 .如 图 2.1 BR. 




















图 2.1 RIP. XPEER eA 
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连接 到 系统 ,一 大 一 小 两 个 柱状 体 代表 两 个 硬盘 ,系统 中 还 有 一 个 打印 机 。 靠 上 方 的 3 个 较 
小 的 长 方 体 代表 3 个 应 用 程序 ,它们 运行 在 用 户 空间 ,通过 内 核 与 外 界 进行 通信 ,应 用 程序 和 
内 核 之 间 的 连 颖 代表 通信 管道 。 

本 章 的 第 一 个 程序 通过 对 以 下 3 个 问题 的 解答 来 学 习 who 命令 ，; 

1. who 命令 能 做 些 什么 ? 

2. who 命令 是 如 何 工 作 的 ? 

3. 如何 编写 who? 


命令 也 是 程序 


在 开始 之 前 ,需要 志明 的 是 ,在 Unix 系统 中 ,几乎 所 有 的 命令 都 是 人 为 编写 的 程序 .如 
who 和 .而且 它 们 中 的 大 多 数 都 是 用 C 语言 写 的 。 当 在 命令 行 中 输入 1s.Shell (命令 解释 
器 ) 就 知道 你 想 运 行 名 字 为 ls 的 程序 。 如 果 对 Is 所 提供 的 功能 还 不 满意 ,完全 可 以 编写 和 使 
AAPA ts are, 

在 Unix 系 统 中 增 如 新 的 命令 是 一 件 很 容易 的 事 。 把 程序 的 可 执行 文件 放 到 以 下 任意 
—* BORAT LT: vbin .yusr/bin /usr/local/bin, 这 些 目录 里 面 存 放 着 很 多 系统 命 今 。 
Unix 系统 中 一 开始 并 没有 这 么 多 的 命令 ,一些 人 编写 程序 用 来 解决 其 个 特定 的 问题 ,而 其 他 
人 也 觉得 这 个 程序 很 有 用 , 随 着 越 来 越 多 的 使 用 .这 个 程序 就 速 新 成 了 Unix 的 标准 命令 。 
启 不 定 吾 一 天 ,你 编写 的 程序 也 会 成 为 标准 命令 。 
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2.3 问题 1: who 命令 能 做 些 什么 


如 果 想 要 知道 都 有 谁 正 在 使 用 使 用 系统 ,只 有 输入 who 命令 ,输出 如 下 : 


$ who 

heckerl  ttypl Jut 21 19:51 (tide75, surfcity. com) 

nlopez ttyp2 Jul 21 18:11 (roam163 - 141. student. ivy. edu) 
dgsulliv ttyp3 Tul 21 14;18 (h004005a8bd64. ne, nediaone. net) 
ackerman ttypé Jul 15 22:40 (asdl- 254. fas. state. edu) 
wwchen ttypS Jul 21 19:57 (circle, square. edu) 

barbier ttyp6 Jul 8 13:08 (labpcl8. elsie. special. edu) 
ramakris ttyp7 Jul 13 08:51 (roam157 - 97, student. ivy. edu) 
czhu ttyp8 Jul 21 12:47 (spa. sailboat, edu) 

bpsteven ttyp9 Jul 21 18:26 (207.178.203.99) 

nolay ttypa Jul 21 20:00 (xyz73 — 200. harvard. edu) 


$ 


每 一 行 代表 一 个 已 经 登录 的 用 户 , 第 1 列 是 用 户 名 ,第 2 若是 终端 名 ,第 3 列 是 登录 时 
间 , 第 4 列 是 用 户 的 登录 地 址 , 某 些 版 本 的 who 命令 在 默认 状态 下 不 给 出 第 4 列 的 内 容 。 


阅读 手册 


通过 直接 运行 命令 ,可 以 了 解 who 的 大 致 功能 ,要 进一步 了 解 who 的 用 法 ,需要 借助 联 
机 帮助 。 

每 一 个 Unix 在 发 崩 的 时 候 都 会 带 上 大 量 的 有 关 各 个 命令 使 用 方法 的 文档 。 以 前 ,这 些 
文档 是 打印 出 来 的 ,现在 有 电子 版 的 可 供 使 用 。 查 看 联机 帮助 的 命令 是 man, 如 要 查看 who 
的 帮助 ,可 输 和 人 : 


$ gan who 
who( 1} 
NAME 
who — Identifies users currently legged in 
SYNUPSIS 
who | - a] |L - AbdhHimMpgrstTu] [file] 
who am i 
who am I 
whoami 


The who command displays information about users and processes on the local system. 
STANDARDS 


Interfaces documented on this reference page conform to industry standards as Follows: 
who: XPG4, XPG4 ~ UNIX 
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Refer to the standards (5) reference page for more information about industry standards and 


associated tags. 
OPTIONS 


-a Specifies all options; processes /var/adm/utmp or the named file with all options on. 





Equivalent to using the - b, -d, -1, -p, -r, -t, — T, and -u options. 
nmore(10 $ ) 


所 有 命令 的 联机 帮助 都 有 相同 的 基本 格式 ,从 第 1 行 可 以 知道 这 是 关于 哪个 命令 的 帮 
助 , 还 可 以 知道 这 个 帮 有 若是 位 于 哪 一 节 的 。 在 这 个 例子 中 ,从 第 1 行 的 内 容 whoCD a EL5n 
道 这 是 who 命令 的 帮助 , 它 的 小 节 编 号 是 1 。Unix 的 联机 帮助 分 为 很 多 节 , 如 第 1 小 节 中 是 
关于 用 户 命 令 的 帮助 ,第 2 小 节 中 是 关于 系统 调用 的 帮助 ,第 5 小 节 中 是 关于 配置 文件 的 帮 
助 。 你 可 查看 一 下 Unix 系统 的 联 和 家 帮助 ,了 解 其 他 节 讲 述 的 内 容 。 

名 字 {NAME) 部 分 包含 命令 的 名 字 以 及 对 这 个 命令 的 简短 说 明 。 

概要 (SYNOPSYS) 部 分 给 出 了 命令 的 用 法 说 明 , 包 括 命令 格式 ,参数 和 选项 列表 。 选 项 
指 的 是 一 个 短线 后 面 紧 跟 着 个 或 多 个 英文 字母 ,如 一 a、-Be, 命 令 的 选项 影响 该 命令 所 进 
行 的 操作 。 

在 联机 帮助 中 , 方 插 导 (|[ -aj]) 表示 该 选项 不 是 一 个 必须 的 部 分 。 帮 助 中 指出 who 的 写 
法 可 以 是 who 或 者 who -a; 或 者 who -加 上 AbdhHlmMpgrstTu 这 些 字母 的 任意 组 合 , 在 
命令 的 末尾 还 可 以 有 一 个 文件 参数 。 

从 帮助 中 可 以 知道 who 命令 还 有 其 他 3 种 形式 : 


who am i 
who am I 


whoami 


从 联机 帮助 中 还 可 以 获得 上 述 形式 的 进一步 帮助 。 

描述 (CDESCRIPTION) 部 分 是 关于 命令 功能 的 详细 痪 述 ,根据 命令 和 平台 的 不 同 ,描述 
的 内 容 也 不 同 , 有 的 简洁 ,精确 ,有 的 包含 了 大 量 的 例子 。 不 管 怎么 样 , 它 描述 了 命令 的 所 有 
功能 ,而 月 是 这 个 命令 的 权威 性 解释 。 

选项 (OQPTIONS) 部 分 给 出 了 命令 行 中 每 一 个 选项 的 说 明 。 早 期 的 Unix 命令 的 功能 者 
很 简单 ,每 个 命令 只 有 一 两 个 选项 ,但 随 着 时 间 的 推移 ,命令 的 功能 越 来 越 多 ,基本 上 每 个 选 
项 用 来 实现 - 个 功能 ,所 以 选项 也 越 来 越 多 , 像 who 命令 就 有 很 多 选项 。 | 

参阅 (SEE ALSO) 部 分 包含 与 这 个 命令 相关 的 其 他 主题 。 有 些 帮 助 还 有 BUG 部 分 。 


2.4 问题 2: who 命令 是 如 何 工作 的 


前 面罩 到 who 命令 可 以 显示 出 当前 系统 中 已 经 登录 的 用 户 信息 ,联机 帮助 中 描述 了 
who 的 功能 和 和 用 法 ,现在 的 问题 是 : who 是 如 何 来 实现 这 些 功能 的 ? 


a 


第 2 意 HI CPR EOLA, 编写 who 命令 。29 。 





你 可 能 会 认为 , 像 who 这 样 的 系统 程序 一 定 会 用 到 一 些 特殊 的 系统 调用 ,需要 高 级 管理 
虽 的 权限 ,要 编 写 这 样 的 程序 得 要 花 很 多 钱 来 购 头 系统 开发 工具 ,包括 光盘 .参考 书 等 。 

实际 上 ,所 需 的 资料 都 在 系统 中 ,你 地 知道 的 仅仅 是 恕 何 找到 这 些 资料 。 

1. A Unix 中 学 习 Unix 

以 下 4 项 技巧 会 有 助 于 你 的 学 习 : 

， 阅读 联机 帮助 

。 搜索 联机 帮助 

- 阅读 .h 文件 

。 从 参阅 部 分 (SEE ALSO) 2B am 

2. 阅读 联机 帮助 

以 who 为 例 , 在 命令 行 输入 如 下 命令 : 


$ man who 


翻 到 描述 部 分 ,如 时 是 在 SunO0S 平 台 上 ,可 以 看 到 如 下 内 容 ; 


DESCRIPTION 
The who utility can list the user-s name, terminal line, login time, elapsed time since 
activity occurred on the line, and the process - ID of the command interpreter (shell) for 
each current UNIX system user. It examines the /var/adm/utmp file to obtain its information. 
If file is given, that file (which must be in utmp(4) format) is examined. Usually, file will 


be /var/adm/wtmp, which contains a history of all the logins since the file was last created. 


上 述 描述 说 明 ,已 登录 用 户 的 信息 是 放 在 文件 /var/adm/utmp 中 的 ,who 通过 读 该 文件 
获得 信息 。 可 以 通过 搜索 联机 帮助 来 了 解 这 个 文件 的 结构 信息 。 

3. 搜索 联机 帮助 

使 用 带 有 选项 一 Kk 的 man 命令 可 以 根据 关键 宇 搜索 联机 帮助 。 如 果 要 查找 “utmp” 的 信 
息 ,在 命令 行 输入 如 下 命令 ， 


$ man - k utap 


endutent getutent (3c) ~ access utmp file entry 
endutxent getutxent (3c)  — access utmpx file entry 
gctutent getutent (3c) — access utmp file entry 
getutid getutent (3c) - access utmp file entry 
getutline getutent (3c) - access utmp file entry 
getutmp getutxent (3c) - access utmpx file entry 
getutmpx getutxent (3c) 一 access utmpx file entry 
getutxent getutxent (3c)  — access utmpx file entry 
getutxid getutxent (3c)  - access utmpx file entry 
getutxline getutxent (3c) ~ access utmpx file entry 
pututline getutent (3c) 一 access utmp file entry 
pututxline getutxent (3c) 一 access utmpx file entry 
setutent getutent (3c) - access utmp file entry 
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setutxent getutxent (3c) access utmpx file entry 
ttyslot ttyslot (3c) find the slot in the utmp fiie of the current user 
updwtmp getutxent (3c) access utmpx file entry 
updwtmpx getutxent (3c) access utmpx file entry 
utmp ulap (4) utmp and wtmp entry formats 
utmp2wtmp acct (1m) overview of accounting and miscellaneous accounting 
commands 
utmpd utmpd (1m) utmp and utmpx monitoring daemon 
utmpname getutent (3c) access utmp file entry 
utmpx utmpx (4) | utmpx and wtmpx entry formats 
utmpxname getutxent (3c) access utmpx file entry 
wimp utmp (4) utmp and wimp entry formats 
wtmpx utmpx (4) utmpx and wtüpx entry formats 
$ 


以 上 的 输出 是 在 SunOS 平台 上 的 和 输出 ,不 同 版 本 的 Unix 输出 可 能 会 有 所 不 同 ,其 中 每 
一 行 都 包含 帮助 的 主题 .标题 和 一 段 简短 的 描述 .注意 这 一 行 : 


utmp  vtmp (4) 一 utmp and wtmp entry formats 


看 起 来 好 像 就 是 所 需要 的 。 这 一 行星 的 4” 是 小 节 编 号 ,说 明 该 帮助 是 位 于 第 4 节 , 在 查 
看 该 帮助 内 容 的 时 候 , 注意 别 把 小 节 编 号 漏 了 ， 


S man 4 utmp 
utmp 4) 
NAME 
utmp, wtmp - Login records 
SYNOPSIS 
# include «:utmp. ho 
DESCRIPTION 
The utmp file records information about who is currently using the system. 


The file is a sequence of utmp entries, as defined in struct utmp in the utmp. h file. 


The utmp structure gives the name of the special file associated with the users terminal, the 
users login name, and the time of the login in the form of time(3), The ut type field is the type 
of entry, which can specify several symbolic constant values. The symbolic constants are 


defined in the utmp. h file. 


The wtmp file records all logins and logouts. A null user name indicated a logout on the 
associated terminal. À terminal erie with a tilde (~) indicates that the system was 
rebooted at the indicated time. The adjacent pair of entries with terminal names referenced bya 
vertical bar (|) or a right brace (]) indicate the system — maintained time just before and just 
after a date command has changed the systems time frame. 

The wtmp file is maintained by login(1) and init(B). Neither of these programs creates the 


file, so, if it is removed, record keeping is turned off, See ac(8) for information on the file. 
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FILES 
/usr/include/utmp.h 
/var/adm/utmp 

mora(B88 X) 





到 此 已 经 离 目 标 不 远 了 ，who 的 联机 帮助 说 明 who 要 读 utmp 这 个 文件 ,进一步 ,从 以 
上 的 说 明 可 以 知道 utmp 这 个 文件 里 面 保存 的 是 结构 数组 ,数组 元 素 是 utmp 类 型 的 结构 ,可 
以 在 utmp. h 中 找到 utmp 类 型 的 定义 , 接 下 来 的 问题 是 ; utmp. h 这 个 文件 在 哪里 ? 

阅读 以 上 帮助 ,可 以 在 FILES 部 分 找到 utmp. h 这 个 文件 的 位 置 ,在 /usr/include A 
录 里 。 

在 进行 下 一 步 ( 分 析 .h 文件 ) 之 前 ,还 有 些 东 西 要 引起 注意 ,上 述 帮 助 提 到 wtmp 这 个 文 
忻 记录 了 关于 登录 和 注销 的 信息 , 它 涉及 到 以 下 几 个 命令 : loginCD .init(8) Mac(8) ,这 些 命 
令 将 在 以 后 的 章节 讲 到 .。 

通过 联机 帮助 来 学 习 Unix 就 像 在 网 络 上 寻找 信息 一 样 , 经 常 能 从 某 一 个 帮助 主题 中 找 
到 相关 信息 ,链接 到 其 他 有 四 或 有 趣 的 主题 。 言 归 正 传 , 接 下 米 分 析 和 utmp. hx d f. 

4. Bit. bh xt 

从 utmp 的 联机 帮助 中 可 以 知道 ,utmp 中 的 数据 结构 定义 在 /usr/inciude/utmp. h 中 。 
在 Unix 系统 中 ,大 多 数 的 头 文件 都 存放 在 /usr/include ix 4 ARE, 2354 C 语言 编译 器 在 源 程 
序 中 发 现 如 下 的 定义 ， 


d include < stdio. h> 


它 会 到 / usr/include 中 寻找 相应 的 头 文 件 。 接 下 来 用 more 命令 来 查看 这 个 文件 的 内 容 : 


$ more /usr/include/utmp.h 


H define UTMP FILE "/var/adm/utmp" 

f define WTMP FILE "/gar/adm/wtup" 

# include —sys/types. h> /* for pid t, time t «/ 
fx 


* Structure of utmp and wtmp files. 

并 

+ Assuming these numbers is unwise. 

af 

# define ut_name ut_user /* compatibility «/ 


struct utmp | 


char ut vuser[ 32]; /* User login nane «/ 

char ut_id[ 14]; /* /ete/inittab id- IDENT_LEN in init «/ 
char ut line[32]; /* device name(console, lnxx) »/ 

short ut type; /* type of entry x/ 

pid tut pid; /* process id x/ 


struct exit status | 


short e termination; /* Process termination status */ 
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short e_exit; /* Process exit status v/ 
} ut exit; /* The exit status of a process marked as DKAD PROCESS » ' 
time t ut. Cime; /» Time entry was made x/ 
char ut bost[$4]; /* Host name same as MAXHOSTNAMELEN «/ 


hs 
/* Definitions for ut type */ 
utap. h(60 & ) 


略 过 所 有 介绍 性 的 内 容 , 直 接 来 看 ump 结构 所 保存 的 登录 记录 。 它 包含 8 个 成 员 变 
IE ut, user 数组 保存 登录 名 .ut_jine 数组 保存 设备 名 , 世 就 是 用 户 的 终端 类 型 ,ut_time 保存 
登录 时 间 ut. host 保存 用 户 用 于 登录 的 远程 计算 机 的 名 字 。 

utmp 这 个 结构 所 包含 的 其 他 成 员 没 有 被 who 命令 所 用 到 。 

各 个 平台 上 的 ump 结构 可 能 不 会 完全 相同 ,具体 的 内 容 由 ump. h FRE, MERE 
量 来 看 , 其 中 的 绝 大 部 分 字段 在 大 多 数 的 Unix 平台 上 是 相同 的 ,被 标记 为 兼容 
(compatibility) 的 行 更 可 能 出 现 不 同 。 通常 头 文件 中 的 注释 提供 了 一 些 有 用 的 信息 。 


who 的 工作 原理 


通过 阅 法 who 和 utmp 的 联机 帮助 ,以 及 头 文件 /usr/include/utmp, ;可 以 知道 who 的 
工作 原理 ,who 通过 读 文 件 米 获 得 需要 的 信息 .而 每 个 登录 的 用 户 在 文件 中 孝 有 对 应 的 记 
F. who 的 工作 流程 可 以 用 图 2. 2 来 表示 。 





打开 ump 


iH id 
显示 记录 | 
关闭 ump 





图 2.2 who 命令 的 数据 流 


文件 中 的 结构 数组 存放 登录 用 户 的 信息 ;所 以 直接 的 仍 法 就 是 把 记录 一 个 一 个 地 浸出 
并 显示 出 来 ,是 不 是 就 这 人 么 简单 呢 ? 

虽然 没有 看 过 who 的 源 代 码 . 但 从 联机 和食 助 中 可 以 了 解 who 要 完成 的 功能 及 实现 原理 ， 
所 涉及 的 数据 结 多 的 信息 也 可 以 从 头 文件 中 获 肥 。 接 下 来 是 实 幅 的 时 候 了 ， 


2.5 问题 3: 如 何 编写 who 


接 下 来 要 编写 自己 的 who 程序 ,为 了 能 够 顺利 完成 ,需要 经 常 从 联机 帮助 中 获取 信息 。 
测试 程序 时 ,要 把 程序 的 输出 与 系统 who 命令 的 输出 做 比较 。 通 过 分 析 可 以 确认 ,在 编写 
who 程序 时 只 有 两 件 事情 是 要 做 的 : 








eee, 一 
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“从 文件 中 读 取 数据 结构 
"将 结构 中 的 信息 以 合适 的 形式 显示 出 来 


2.5.1 问题 : 如 何 从 文件 中 读 取 数 据 结 构 


可 以 调用 geto 和 fgets 函数 从 文件 中 读 字 符 或 字符 串 ,但 是 如 何 读 出 数据 结 移 中 的 信息 
We? 当然 可 以 用 gete RPE WME AAR ARR. BRAKE 
出 整个 数据 结构 的 方法 。 

还 是 到 联机 帮助 中 寻找 管 案 , 可 以 找 那些 与 file 和 read 都 有 关 的 帮助 ,但 是 man 命令 的 
选项 一 k( 根 据 关 键 字 查 找 ) 只 支持 一 个 关键 字 的 查找 。 在 我 的 系统 中 ,与 file 相关 的 主题 有 
537 个 ,如 果 一 个 一 个 地 米 看 ,这 就 太 慢 了 ,可 以 借助 Unix 命令 grep 来 从 这 537 个 主题 中 查 


KG read 相关 的 主题 ， 
5 man ~k file : grep read 
 llseek (2) — reposition read/write file offset 
fileevent (n) 一 Execute a script when a channel becomes readable or writable 
gftype (1) 一 translate a generic font file for humans to read 
lseek (2) ~ reposition read/write file offset 
macsave (1) Save Mac files read from standard input 
read (2) - read from a file descriptor 
readprofile (1) - a tool to read kernel profiling information 
scr dump, scr restore, scr init, ser set (3) — read (write) a curses screen 


from (to) a file 
tee (1) - read from standard input and write to standard output and files 


$ 


其 中 最 有 可 能 的 是 read 2o ,其 他 的 看 起 来 都 不 像 , 所 以 进一步 地 看 read(2) 的 帮助 : 


$ man 2 read 
READ 2) System calls READ(C23 
NAME 
Read - read froma tile descriptor 
SYNOPSIS 


# include —unistd.h7- 
ssize t read(int fd, void * buf, size t count); 

DESCRIPTION 
read() attempts to read up to count bytes from file descriptor fd into the buffer starting 
at buf. 
If count is zero, read() returns zero and has no other results. If count is greater than SSIZE- 
MAX, the result is unspecified. 

RETURN VALUF. 
On success, the number of bytes read is returned (zero indicates end of file), and the file 
position is advanced by this number. It is not an error if this number is smaller than the number 
of bytes requested; this may happen for example because fewer bytes are actually available 
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right now(maybe because we were close to end - of — file, or because we are reading from a pope, 
or fron a terminal), or because read() wes interrupted by a signal. On error, - 1 is returned, 
and errno is set appropriately. In this case it is left unspecified whether the file position(if 


any) changes. 


这 个 系统 调用 可 以 将 文件 中 一 定数 目的 字 节 读 人 一 个 缓冲 区 ,因为 每 次 都 要 读 人 一 个 
数据 结构 ,所 以 要 用 sizeoflstruct utmp) 来 指定 每 次 恋 入 的 字 节 数 。read 函数 需要 一 个 文件 
描述 符 作为 输入 参数 ,如 何 得 到 文件 揽 述 符 呢 ?在 read 的 联机 和 帮助 中 的 最 后 部 分 有 以 下 
描述 : 


RELATED INFORMATION( called SEE ALSO in some versions) 
Functions; fcntl(2), creat(2), dup(2), ioctl1(2), getmsq(2), lockf(3), lseek(2), mtio(7), 
open(2), pipe(2), poll(2), socket(2), socketpa:r(2), ternios(4),streamio(?7),opendir(3), 
lockf(3) 
Standards: standards(5) 


其 中 包含 对 open(2) 的 引用 .在 命令 行 输入 : 
S pan 2 open 


查看 open WILE BA. J open 中 又 可 以 找到 对 close 的 引用 ,通过 阅读 联机 帮助 ,可 以 知道 
以 上 3 个 系统 调用 都 是 进行 文件 宫 作 所 必需 的 。 


2.5.2 答案 : 使 用 open,read 和 close 


使 用 上 还 3 个 系统 调用 可 以 从 ump 文件 中 取得 用 户 登 录 信 息 , 这 3 个 系统 凋 用 的 联机 
帮助 会 包含 很 多 内 容 ,尤其 是 应 用 于 管道 .设备 和 其 他 数据 源 时 .会 涉及 很 多 不 常用 的 选项 
以 及 复杂 的 用 法 ,但 在 这 里 ,只 需要 关心 它们 最 基本 的 用 法 。 

|l. 打开 一 个 文件 : open 

这 个 系统 调用 在 进程 和 文件 之 间 建 立 一 条 连接 ,这 个 连接 被 称 为 文件 描述 符 , 它 就 像 一 
条 由 进程 通 向 内 核 的 管道 .如 图 2, 3 所 示 。 








图 2,3 文件 描述 行 是 对 文件 的 连接 


open 的 基本 用 法 如 下 。 
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open 

目标 打开 一 个 文件 PE 
头 文件 # include <fentl. h> 
函数 原型 int fd = open(char * name, int how? 
参数 name 文件 名 

ow O_RDONLY, O_WRONLY, or O_RDWR 
A ©) TN —1 ia Bl BR 

int 成 功 返 回 


要 打开 一 个 文件 ,必须 指定 文件 名 和 打开 模式 ,有 3 种 打开 模式 ; REARS .可 读 可 写 ， 
分 别 对 应 于 口 RDONLY,O WRONLY.,O, RDWR , ix fE 5k & (E /usr/include/fentl, h 中 有 
定义 。 

打开 文件 是 内 核 提 供 的 服务 ,如 果 在 打开 过 程 中 内 核 检 测 到 任何 错误 ,这 个 系统 调用 就 
会 返回 一 1。 

错误 类 型 是 各 种 各 样 的 ;如 : 要 打 升 的 文件 不 存在 。 即 使 文件 存在 ,也 可 能 因为 权限 不 
够 而 无 法 打开 ,或 者 是 无 权 访 问 文件 所 在 的 目录 。 在 open 的 联机 帮助 中 列 出 了 和 种 可 能 的 
错误 ,本 章 结 尾 还 会 进一步 讨论 出 错 处 理 的 问题 。 

当 一 个 文件 已 经 被 打开 ,是 和 否 允 许 再 次 打开 呢 ? 这 种 情况 发 生存 有 多 个 进程 要 同时 访 
问 一 个 文件 的 时 候 。Umnix 并 不 禁止 一 个 文件 同时 被 多 个 进程 访问 ,如 果 禁 止 的 话 , 那 两 个 用 
户 就 无 法 同时 使 用 who 命令 了 。 

如 果 文 件 被 顺利 打开 ,内 核 会 返回 一 个 正 整 数 的 值 ,这 个 数值 就 叫做 文件 描述 符 。 刚 才 
讲 过 ,打开 文件 会 建立 进程 和 文件 之 间 的 连接 ,文件 描述 符 就 是 用 来 惟一 标识 这 个 连接 的 ， 
如 果 同 时 打开 好 几 个 文件 ,它们 所 对 应 的 文件 描述 符 是 不 同 的 ,和 如果 将 一 个 文件 打开 多 次 ， 
对 应 的 文件 描述 符 也 不 相同 。 

必须 通过 文件 描述 符 对 文件 进行 操作 ，。 

2. 从 文件 读 取 数据 ; read 

还 过 read RK Me read 的 用 法 如 下 : 





























read 
目标 把 数据 读 取 到 缓冲 区 
头 文件 # include <unistd, hz» 
函数 原型 OO ssize t numread = read(int fd, void « buf, size_t qty) 
参数 fd 文件 描述 符 


buf 用 来 存放 数据 的 月 的 缓冲 区 
qty 要 谈 取 的 字 节 数 
返回 值 = 38 [f 

numread A ty i He 








read 这 个 系统 调用 请 求 内 核 从 fd BB m AY) X EER aty 宁 节 的 数据 ,存放 到 buf 
所 指定 的 内 存 空间 中 ,内 核 如 果 成 功 地 读 取 了 数据 ,就 返回 所 读 取 的 字 节 数 自 ,否则 返 
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这 里 有 个 问题 ,就 是 最 终 读 到 的 数据 可 能 没有 你 所 要 求 的 那么 多 ,为 什么 呢 ? 可 能 是 因 
为 文件 中 剩余 的 数据 没有 要 求 的 那么 多 。 例 如 :程序 要 求 读 1000 字 节 的 数据 ,而 文件 的 长 度 
A 500 个 字 节 ,那么 程序 就 只 能 读 到 500 字 节 。 当 读 到 文件 未 尾 时 再 要 读 的 话 ,numread 会 
是 0, 因 为 已 经 没有 数据 可 读 了 。 

润 用 read 函数 时 可 能 会 遇 到 的 错误 在 联机 帮助 中 有 详细 的 描述 。 

3, HB] x4. close 

当 不 需要 再 对 文件 进行 读 写 操 作 时 ,就 要 把 文件 关闭 。close 的 用 法 如 下 ， 




















close 
目标 关闭 一 个 义 件 
头 文 件 # include <unistd h> 
St E: int result = closetint fd) 
参数 fd 文件 描述 符 
一 】 JABS 
ZRA 0 成 功 关 闭 


close 这 个 系统 调用 会 关闭 进程 和 文件 fd 之 闻 的 连接 ,如 上 凡 关 闭 的 这 程 中 出 现 错误 ， 
close 返回 一 1, 例 如 : fd 所 指 的 文件 并 不 存在 。 其 他 可 能 遇 到 的 错误 在 联机 帮助 中 有 详细 的 
描述 。 


2.5.3 编写 whol.c 


到 目前 为 止 , 已 经 离 目 标 很 近 了 ,明白 了 who 的 工作 原理 ,知道 了 要 先 打 开 文件 ,然后 读 
数据 ,最 后 关闭 文件 ,以 及 上 述 操作 所 需要 的 系统 调用 ,这 样 可 以 编写 如 下 代码 ， 


/* whol.c - a first version of the who program 

* open, read UTMP file, and show results 
x/ 

# include -;stdio.h— 

# include <utmp. h> 

# include < fentl, h> 

H include < unistd. h> 


d define SHOWHOST /* include remote machine on output */ 
int main() 
i 

struct utmp current record; /* read info into here «/ 

int utnpfd; /* read from this descriptor x/ 

int reclen = sizeof(current record); 

if ( Cutmpfd = open(UTMP FTLE, O RDONLY)} == — 10i 


perror( UTMP FILE ); /* UTMP FILE is in utmp. h */ 
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exit}; 


L 
i 


while ( read(utmpfd, &current record, reclen) == reclen ) 


show info(&current record); 
close(utmpfd) ; 
return 0; 


} 


/* went ok */ 


这 段 代 码 应 用 了 前 面 学 到 的 内 容 , 在 while 循环 内 从 文件 中 逐条 地 把 数据 该 取 出 来 , 存 
放 在 记录 current. record 中 ,然后 调用 函数 show info 把 登录 信息 显示 出 来 , 当 文 件 中 已 经 


没有 数据 时 ,循环 结束 ,最 后 关闭 文件 返回 。 


kVA TR perror 3X E — AR Bo o8 Xt ,使 用 这 个 函数 来 处 理 系 统 报错 ,关于 错误 处 


理 在 本 章 结尾 还 会 讨论 。 
2.5.4 显示 登录 信息 


“Fide show info 的 第 一 个 版 本 , 它 的 功能 是 显示 utmp 记录 的 内 容 ; 


fm 


» show info() 


» displays contents of the utmp struct in human readable form 


» * npote« these sizes should not be hardwired 


xf 
show info( struct utmp x utbufp } 
{ 


printf("% —-8.8s", utbufp —>ut_name); 


F 


printf(" “); 


Printft"% -8.8s", utbufp —-ut_line); 


printf(" "); 
printf(" € 101d", utbufp ——ut time); 
printf(" '); 
+ ifdef SHOWHOST 
printf("( € s)", utbufp —-ut host); 
# endif 
prantf("\n"); 
} 


/* the logname */ 
/* a space xA 

/* the tty x/ 

/* a space #/ 

/* login time «/ 


/* a space «/ 
/* tbe host «/ 


/* newline x/ 


在 使 用 printi 函数 输出 时 ,使 用 了 定 宽度 的 格式 ,这 样 做 是 为 了 与 系统 的 who 命令 的 输 
出 一 致 ,ut_time 字段 是 以 long int 的 格式 输出 的 ,在 美文 件 中 这 个 字段 被 定义 为 time_t 类 
型 ,但 到 目前 还 不 知道 time t 类 型 的 数据 应 和 如何 处 理 。 


将 上 述 代码 编译 .运行 : 


$ cc whol.c - o whol 
5 whol 


38 * 


system b 


run- leve 


LOGIN console 
ttypl 
shpyrko  ttyp2 
acotton ttyp3 
ttypá 
spradlin ttyps5 
dkoh ttyp6 
spradlin ttyp7 
king ttyp8 
berschba ttyp9 
rserved  ttypa 
dabel ttypb 
ttypc 
rserved  ttypd 
dkoh ttype 
ttypf 
malay ttyqo 
ttyqi 
ttyqz 
ttyq3 
ttyg4 
ttyq» 
ttyq6 
ttyq? 
cweiner  ttyq& 
ttyqa 
ttyq9 
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852601411 () 

952501411 () 

952601416 () 

952501416 () 

952601417 () 

952601417 (> 

952601413 () 

952601419 () 

952601423 () 

952601566 () 

952601566 () 

958240822 (2 

964318862 (nas? — 093.gas. swamp. org) 
964319088 (math - quest04. williams. edu) 
964320298 (j 

063881486 (h002078c6adfb. ne. rusty. net) 
964314388 (128.103.223.110) 

964058662 (h002078c6adfb. ne. rusty, net) 
964279969 (blade - runner. mit. edu) 
964188340 (dudley. learned. edu) 
963538145 (gique, eas, ivy. edu) 
964319455 (rcam193 - 27. student. state. edu) 
964319645 () 

963538287 (gigue.eas. ivy. edu) 
964298769 (128.103. 223, 110) 

964314510 (D 

864310621 (xyz73 — 200. harvard. edu) 
964311665 () 

964310757 () 

964304284 () 

964305014 () 

964299803 () 

964219533 (D 

964215661 ©) 

964212019 (roam175 - 157. student. stats. edu) 
964277078 () 

964231347 () 


将 上 述 输出 与 系统 who 命令 的 输出 做 对 比 ， 


$ who 


shpyrko ttyp2 Jul 22 22:21 (nasi - 093. gas. swamp. edu) 
acotton ttyp3 Jul 22 22:24 (math - guest04. Williams, edu) 
spradlin ttyp5 Jul 17 20;51 (h002078c6adfb. ne. rusty. net) 
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dkoh ttyp6 jul 22 21:06 (128.103. 223.110} 
sprédiin ttyp? Jul 19 22:04 (h002078c6adfb. ne. rusty. net) 
king ttypB Jul 22 11:32 (blade - runner. mit. edu) 


berschba ttyp? Jul 21 10:05 (dudley. learned. edu} 

rserved ttypa Jul 13 21;29 (gigue. eas. ivy. edu) 

dabel ttypb Jul 22 22.30 (roam193 - 27. student. state, edu) 
rserved ttypd Jul 13 21;31 (gigue. eas. harvard. edu) 

dkoh ttype Jul 22 16:46 (128.103.223.110) 

molay ttyg0 Jul 22 20.03 (xgz73 - 200. harvard. edu) 

cweiner ttyq8 Jul 21 16-40 (roam175 — 157. student. stats. edu) 
$ 


自己 编写 的 who 已 经 可 以 工作 了 , 它 能 正确 显示 出 用 户 名 ARS VER ELS RR 
统 的 who 比 起 来 还 不 完善 ,至少 在 两 处 有 问题 。 

需要 改进 的 : 

。 消除 空白 记录 

* 正确 显示 登录 时 间 


2.5.5 编写 who2.ec 


针对 版 本 1 的 两 个 问题 ,继续 编写 who 的 第 2 个 版 本 ,解决 问题 的 方法 还 是 通过 阅读 联 
机 帮助 和 头 文件 。 

1. MRE BIER 

系统 所 带 的 who 只 列 出 已 登录 用 户 的 信息 , 而 刚才 编写 的 who 1 除了 会 列 出 已 登录 的 
AP ,还 会 显示 其 他 的 信息 ,而 这 些 都 来 自 于 utmp 文件 。 实 际 上 ump 包含 所 有 终端 的 信 
息 , 英 至 那些 尚未 被 用 到 的 终端 的 信息 也 会 存放 在 utmp 中 ,所 以 览 修改 刚才 的 程序 ,做 到 能 
够 区 分 出 哪些 终端 对 应 活动 的 用 户 。 如 何 区 分 呢 ? 

一 种 简单 的 思路 是 过 泪 掉 那些 用 户 名 为 空 的 记录 ,但 这 样 做 是 有 问题 的 ,如 刚才 的 输出 
中 ,用 户 名 为 LOGIN 的 那 一 行 对 应 的 是 控制 台 , 而 不 是 一 个 真实 的 用 户 。 最 好 有 一 种 方法 
能 够 指出 某 一 条 记录 确实 对 应 着 已 登录 的 用 户 。 

fe /usr/include/utmp. h P. HATAR: 


/* Definitions tor ut type */ 


# define EMPTY Q 
# define RUN LVL 1 
# define BOOT TIME 2 
# define OLD TIME 3 
# define NEW TIME 4 
+ define INIT PROCESS 5 
define LOGiN PROCESS 6 
# define USER PROCESS — 7 
# define DEAD PROCESS 8 


/* Process spawned by "init" «/ 
fs A "getty" process waiting for login */ 


/* A user process */ 


= 40 。 Unix/Linux 编程 实践 教程 


ump 结构 中 有 一 个 成 员 ut_trype, 当 它 的 值 为 ?7(USER_PRUOCESS) 时 ,表示 这 是 一 个 已 
经 登录 的 用 广 。 根 据 这 一 点 ,对 原来 的 程序 做 以 下 修改 ,就 可 以 消除 空白 行 : 





show info( struct utmp x utbufp } 


I 
i 
4 


if ( utbufp——-ut type |= USER PROCESS ) /* users only «/ 
return; 
printf("& - 8,8s", utbufp —-ut name); /* the username x/ 


2. VAT ie ZAR BR A I8] 
PE REAR AA B 53 zs A, SAS PRR MBA Ba. A Bi 
XX ELTE BOAR CE. VEXEBLTU BO HK FA TB] BD EIR & ,在 命令 行 输入 : 


5 man - k tine 


会 返 同 很 多 条 记录 ,我 兽 在 某 个 Unix 系统 上 得 到 73 Kick, Me 53 i Unix 系统 上 得 到 
了 97 条 。 当 然 可 以 性 着 眼珠 一 条 一 条 地 看 ,不 过 用 Unix 和 白 带 的 工具 米 过 滤 出 有 用 的 东西 
是 一 个 更 好 的 方法 。 以 下 是 现 种 过 滤 方 法 : 


S man -k time | grep transfora 


S man -k time | grep - i convert 


很 多 记录 都 涉及 到 /usr/include/timne.h 这 个 头 文件 ,这 里 而 有 很 多 有 用 的 信息 。 

(1) Unix 存 情 时 间 的 方式 ; time_t 数据 类 型 

Unix 中 时 间 是 用 一 个 整数 来 表示 的 , 它 的 数值 是 从 1970 年 1 月 1 日 0 时 开始 所 经 过 的 
PR ,在 头 文 件 time h PAL FAR: 


typedef long int time_t; 


存储 时 间 的 结构 time t 实际 上 就 是 long int. 

(2) 将 time t BASHA: ctime 

ctime 将 表示 时 间 的 整数 值 转换 成 人 们 是 常 所 使 用 的 时 间 形 式 。 在 联机 帮助 的 第 3 节 有 
ctime 的 详细 说 明 . 


5 man 3 ctime 


CTIME( 3) Linux Programmers Manual CTIME( 3) 


NAME 


asctime, ctime, gmtime, localtime, mktime — transform binary date and time to ASCII 


SYNOPSIS 
H include «time. K> 
Char * asctime(const struct tm * timeptr); 
char * ctime(const time t »* timep); 
struct tm x qmtime(const time t x» timep); 


struct tn * localtime(const time t * timep); 
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time t mktime(struct tm + timeptr); 


extern char * tzname[ 2]; 
long int timezone; 


extern int daylight; 


DESCRIPTION 
The ctime(), gmtime() and localtime() functions all take an argument of data type time t which 
represents calendar time. When interpreted as an absolute time value, it represents the number 


of seconds elapsed since 00:00:00 on January 1, 1970, Coordinated Universal Time (UTC). 
The ctime() function converts the calendar time timep into a string of the form 
"Wed Jun 30 21-49-08 1993Xn" 


The abbreviations for the days of the week are Sun, Mon, Tue, Wed, Thu, Fri, and Sat. The 
abbreviations for the months are Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct, Nov, and Dec. 
The return value points to a stalically allocated string which might be overwritten by 


subsequent calls to any of the date and time functions. The function also 


这 正 是 所 需要 的 ,在 utmp 结构 中 有 一 个 time t 类 型 的 数据 ,而 最 终 需要 的 是 类 似 于 以 
下 的 输出 : 


Jun 30 21 :49 


ctime( 3) AREA A — 1-48 [8] time. t OTR £F ae E Aga [8] EE BRT PG 


Wed Jun 30 21:49:08 1993\n 


PS PS A PS PS APA I I AAA 


注意 ; 并 不 是 所 有 的 字符 串 内 容 都 需要 ,需要 的 是 其 中 用 "人 标识 出 来 的 部 分 , 接 下 来 就 
很 容易 处 理 了 ,将 ctime 返回 的 字符 串 从 第 4 个 字符 开始, 输出 12 个 字符 : 


printf("% 12.125" ctime(&t) +4) 


3. 把 刚才 学 的 两 点 综合 起 来 
现在 明白 了 如 何 消除 空白 记录 和 如何 正 确 地 显示 ut_time 中 的 时 间 值 ,可 以 着 手 重新 编 
写 who2. c 如 下 : 


/* who2,c — read /etc/utmp and list info therein 


* ~ suppresses empty records 
* — formats time nicely 
*/ 


# include <(stdio. h> 
# include — «unistd, h> 
# include utmp. h> 

# include <(fentl. h> 
# include «time. h> 








» 42 »， Unix/Linux 编程 实践 教程 





/* 村 define SHOWHOST */ 


void showtime( iong), 


void show info(struct utmp *9); 


int maint) 
1 
struct utmp  uthuf; /* read info into here «/ 
int utnpfd; /* read from this descriptor +/ 
if ( (utmpfd = open(UTMP FILE, O RDONLY)) == - 1l 
perror(UTMP FILE); 
exit(1) F 
} 
while( read(utmpfd, &utbuf, sizeof(utbuf)) == sizeof(utbuf) ) 


show info( &utbuf 5; 
close(utmpfd) ; 


return Q; 


* show infol) 


x displays the contents of the utmp struct 

关 in human readable form 

* * displays nothing if record has no user name 
* "i 


void show info( struct utmp * utbufp ) 
{ 


x 


if ( utbufp->ut_type !- USER PROCESS ) 


return; 
printf("% —8.8s", utbufp —-ut name), /* the logname x/ 
printf(" "); /* a space «/ 
printf(" 5$ ~8.98s", utbufp-7-ut line); /* the tty x/ 
printf! "); /* a space «/ 
showtime( utbufp —-ut time ); /* display time */ 
it ifdef SHOWHOST 
if ( utbufp —ut host[0| t= 'A0' ) 
printf(" ( $s)", utbufp — ut host); /* the host «/ 
# endif 
printf('An"); /* newline x 


1 


void showtime( long timeval ) 
{* 


* displays time in a format fit for human consumption 


ina -一 一 - a SRT UR Re - 9 We cmo ee eee stitch HS Se ee Le 
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* uses ctime to build a string then picks parts out of it 
+ Note; *%12.12s prints a string 12 chars wide and LIMITS 
* it to 1l2chars. 
xf 
char * cp /* to hold address of time x/ 
cp = ctime(&timeval); /* convert time to string */ 
/* string looks like «/ 
/* Mon Feb 4 00:46:40 EST 1991 x»/ 
/* 0123456789012345. »/ 
printf(" &$12.12s", Cpt 42; /x pick 12 chars from pos 4 xf 


4. 测试 who2,.c 
为 了 使 于 对 比 , 先 关 掉 SHOWHOST 这 个 选项 ,编译 who2. c 将 其 结果 与 系统 所 带 的 
who 进行 比较 ， 


$ cc who2.c ~ o who2 

$ who2 

rlscott ttyp2 Jul 23 01:07 
acollon ttyp3 Jul 22 22;24 
spradlin ttyp5 Jul 17 20:51 
spradlin ttyp? Jul 19 22:04 
king ttyp8 Jul 22 11 32 
berschba ttyp9 Jul 21 10:05 
rserved ttypa Jul 13 21:29 
rserved ttypd Jul 13 21,31 
molay ttyq0 Jul 22 20;03 
cweiner  ttyq8 Jul 21 16:40 
mnabavi  ttyx2 Apr 1d 23;11 


$ who 

rlscott ttyp2 Jul 23 01:07 
acotton ttyp3 Jul 22 22:24 
spradlin ttyp5 Jul 17 20:51 
spradlin ttyp? Jul 19 22:04 
king ttyp8 Jul 22 11;32 
berschba ttyp9 Jul 21 10.05 
rserved ttypa Jul 13 21:28 
rserved ttypd Jul 13 21:31 
molay ttyqO Jul 22 20:03 
cweiner ttyg8 Jul 21 16:40 
mnabavi ttyx2 Apr 10 23-11 


$ 
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将 who? 与 系统 的 who 对 比 -下 ,除了 革 些 字段 的 宽度 有 些 不 同 外 ,其 他 的 都 完全 一 致 ， 
而 要 调整 宽度 也 是 很 容易 的 。 

这 里 的 who 只 列 出 了 3 个 字段 , 用 户 和 名 ,终端 类 型 和 登录 时 间 ,有些 版 本 的 who 还 会 列 
出 用 户 所 在 主机 的 信息 ,这 个 功能 在 who? 中 通过 预 编译 选项 SHOWHOST 控制 。 


2.5.6 回顾 与 展望 


这 一 章 是 从 这 样 一 个 简单 的 问题 开始 的 : Unix 的 who 命令 是 如 何 工作 的 ? 接 下 来 分 3 
步 走 ,首先 弄 清 who 的 功能 ,然后 通过 联机 帮助 和 头 文件 知道 了 who 的 工作 原理 ,最 后 ,通过 
编写 自己 的 who 来 检验 对 知识 的 掌握 程度 。 

在 这 3 步 中 .学 习 了 如 和 何 使 用 联机 帮助 ,如何 使 用 头 文件 ,了 解 了 记录 登录 信息 的 utmp 
文件 的 结构 ,知道 了 Unix 处 理 时 间 的 方式 ,学 会 了 通过 相关 主题 来 获取 信息 ,这些 知识 对 党 
握 Unix 编程 是 很 重要 的 。 道 过 编写 程序 ,更 有 深化 了 对 知识 的 理解 和 掌握 。 


2.6 编写 cp GENI) 
TE who 命令 中 介绍 了 如 何 读 文件 , 接 下 来 要 通过 cp 命令 来 学 习 如 何 写 文 件 。 
2.6.1 问题 1: ep 命令 能 做 些 什 么 
cp 能够 复制 文件 ,典型 的 用 法 是 ; 








5 cp source ~ file target - file 


t target - file 所 指定 的 文件 不 存在 ,cp 就 创建 这 个 文件 ,如 果 已 经 存在 就 覆盖 ,target 
-file fj [AJ 2€ 5j source - file 相同 。 


2.6.2 问题 2: cp 命令 是 如 何 创 建 / 重 写 文件 的 


1. 创建 / 重 写 文件 
创建 或 重 写 文件 的 一 种 方法 是 使 用 系统 调用 函数 creat. creat 的 用 法 如 下 : 

















creat 

目标 创建 / 重 写 一 个 文件 
头 文件 dt include <fentl. hz 
函数 原型 int fd = creat(char * filename, mode, t mode) 
参数 filename ZA 

mode 访问 模式 
返 坷 值 = 过 到 错误 

fd 成 功 创建 


creat 告诉 内 核 创 建 :个 名 为 filename 的 文件 ,如 果 这 个 文件 不 存在 ,就 创建 它 , 如 果 已 
经 存在 ,就 把 它 的 内 容 清空 ,把 文件 的 长 度 设 为 0。 
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如 果 内 核 成 功 地 创建 了 文件 ,那么 文件 的 许可 位 (permission bits) 被 设置 为 由 第 2 FS 
数 mode 所 指定 的 值 , 如 : 


fd = creat( "addressbook", 0644); 


创建 一 个 名 为 addressbook 的 文件 ,如 时 文件 不 存在 ,那么 文件 的 许可 位 被 说 为 
rw-r-r-- {参见 第 3 章 )。 如 果 文 件 已 经 存在 , 它 的 内 容 会 被 清空 。 任 一 种 情况 下 id 都 会 是 
指向 addressbook 的 文件 描述 符 。 

2， 写 文件 

用 write 系统 调用 向 已 打开 的 文件 中 写 人 数据 。 




















write 
] 目标 将 内 存 中 的 数据 写 人 文件 
xxt # include «unisid, h> 
= 函数 原型 ssize_t result = writeCint fd, void * buf, Lt agit) mum 
参数 fd 文件 描述 符 
buf 内 存 数据 
ami 要 写 的 字 节 数 
返回 值 =i 过 到 错误 


num written MBA A 


write 这 个 系统 调用 告诉 内 核 将 内 存 中 指定 的 数据 写 人 文件 ,如 果 内 核 不 能 写 人 或 写 信 
失败 ,write 返回 一 1, 如 果 写 入 成 功 , 则 返 加 写 人 的 字 节 数 ， 

为 什么 实际 写 人 的 字 节 数 会 少 于 所 要 求 的 呢 ? 有 两 个 原因 ,第 一 个 是 有 的 系统 对 文件 
的 最 大 尺寸 有 限制, 第 二 个 是 磁盘 空间 接近 满 了 。 在 上 述 两 种 情况 下 ,内核 都 会 尽量 把 数据 
往 文件 中 写 , 并 将 实际 写 人 的 字 节 数 返 回 , 所 以 调用 write 后 都 必须 检查 返回 值 是 否 与 要 写 
人 的 相同 ,如 果 不 同 ,就 要 采取 相应 的 措施 。 


2.6.3 问题 3: 如 何 编写 cp 
下 面 通过 编写 一 个 实际 的 cp 来 检查 对 知识 的 理解 ,程序 的 流程 如 下 : 


open sourcefile for reading 
open copyfile for writing 
十 一 人 > read from source to buffer -— eof? -+ 


| | write from buffer to copy | 


close sourcefile Seas SSeS + 


close copyfile 


图 2.4 显示 了 涉及 的 对 象 及 数据 流 的 走向 。 
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图 2.4 通过 该 和 写 来 复制 文件 


ACUTE ERE E E , 源 文件 在 左边 ,右边 的 是 目标 文件 .进程 在 用 户 空 间 , 缓 冲 区 是 进程 内 存 
的 一 部 分 ,进程 有 两 个 文件 描述 符 ,一 个 指向 源 文 件 ,一 个 指向 目标 文件 ,从 源 文 件 中 读 取 数 
据 写 人 缓冲 ,再 将 缓冲 中 的 数据 写 人 目标 文件 。 下 面 就 是 实现 上 述 逻 辑 的 代码 : 


/** cpl.c 
* version] of cp - uses read and write with tunable buffer size 
* 
* usage: cpl src dest 
n/ 
# include <stdio.h> 
# include <Cunistd. h> 
Ħ# include <fentl.h> 


# define BUFFRRSIZE 4096 
# define COPYMODE 0644 


void cops(char x , char »); 


main(int ac, char x avi |) 
{ 
inc in fd, out fd, n chars; 
char buf [BUFFERSIZE]; 
/* check axgs «/ 


if C ac 12 3) 
fprintf( stderr, "usage: % s source destimation\n", ¥ av); 
exit(1); 
] 
/* open files «/ 
if ( Cin fd- open(av(1], O RDONLY)) == -1) 


oops "Cannot open ", av[1]); 


if € (out fd- creat{ av(2), COPYMODE)) == -1) 
oops( "Cannot creat", av[2]}); 
/* copy files 4/ 
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while ( (n chars = read(in fd , buf, BUFFERSIZE)) — 0 ) 
if ( write( out fd, buf, n chars ) t= n chars ) 
cops("Write error to ", av[2]); 
if(n chars == -1) 
oops("Read error from ", avl1]); 


/* close files «/ 


if ( close(in fd) == -1 || close(out_fd) == -1) 
oops("Error closing files", ""); 
? 
void oops(char * sil, char * 82) 
1 
fprintf(stderr,"Error: *s", s1); 
perror(s2); 
exit(1); 


1 
J 


编译 并 测试 上 述 代 码 ， 


5 cc cpl.c -o cpl 

$ cpl cpl copy. of, cpl 

s ls ~ 1 cpl copy. of. cpl 

-rw-r--r-- l bruce bruce 37419 Jul 23 03:12 copy. of. cpl 
-rwxrwxr-x l bruce bruce 37419 Jul 23 03:08 cpl 

S cmp cpl copy. of, cpl 

3 


用 Unix 所 带 的 文件 比较 工具 emp EGER OCR RIL, emp 没有 给 
提示 ,说 明 它们 的 内 容 完 全 相同 。 
接 下 来 看 看 程序 对 错误 输入 的 反映 ,在 命令 行 输入， 





$ Cpl xxx123 filel 

Error: Cannot open xxx123; No such file or directory 
S cpl cpl /tmp 

Error; Cannot creat /tmp; Is a directory 


时 任何 


阅读 与 系统 调用 相关 的 联机 帮助 ,看 看 还 有 什么 错误 可 能 发 生 , 逐一 地 测 坛 这 些 错 误 情 


沉 。 注 意 不 要 覆盖 掉 那 些 想 要 保存 的 文件 。 
2.6.4 Unix 编程 看 起 来 好 像 很 简单 


who 命令 从 文件 中 读数 据 然 后 以 一 定 的 格式 输出 ,cp 命令 从 一 个 文件 中 读数 据 然后 写 


入 到 另外 的 文件 中 ,它们 用 到 的 是 类 似 的 系统 调用 ,都 是 在 内 存 和 文件 之 间 交 换 数据 
从 联机 帮助 和 头 文 件 中 得 到 足够 的 信息 来 进行 编程 ， 
这 样 看 来 , Unix 编程 好 像 真 的 不 难 ,是 不 是 还 有 些 东 西 没 涉 及 到 ? 管 案 是 肯定 的 


;可 以 


,还 记 
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不 记得 那 3 个 问题 ? 在 这 里 要 多 问 一 个 问题 : 如 何 使 你 的 程序 运行 得 更 加 有 效 ? 


2.7 提高 文件 1/0 效率 的 方法 : 使 用 缓冲 


cpl 中 定义 了 BUFFERSIZE 这 个 常量 ,用 于 标识 每 次 读 / 写 操作 的 数据 长 度 ,这 旦 的 





是 4096, 接 下 来 是 个 很 重要 的 问题 ; 缓冲 区 的 大 小 对 件 能 有 影响 赎 ? 
2.7.1 缓冲 区 的 大 小 对 性 能 的 影响 


应 


缓冲 区 的 大 小 对 性 能 有 很 大 的 影响 ,举例 来 说 ,用 人 久子 把 汤 从 一 个 饮 里 器 到 为 一 个 玖 


里 ;用 较 大 的 久子 就 可 以 少 理 儿 次 ,从 而 节省 时 间 。 
对 文件 操作 而 言 也 是 这 样 的 ,来 看 对 一 个 2500 宇 节 的 文件 的 copy 操作 ; 


文件 大 小 = 2500 5g i5 
foe BRA = 100 字 节 

WARE 25 次 readO Hl 25 次 write 
如 果 缓冲 区 大 小 = 1000 ^E 

那么 需要 3 次 read() 利 3 次 writeO 


把 缓冲 区 从 100 字 节 增加 到 1000 F 六 会 使 系统 调用 的 次 数 从 50 次 减少 到 6 次 ,这 确 








很 可 观 。 

复制 一 个 5MB 大 小 的 文件 ,不 同 的 缓冲 区 所 对 应 的 执行 时 间 如 下 ， 
缓冲 大 小 执行 时 间 /s 

1 50. 29 

4 l 12. 81 

16 3.28 

32 0. 96 

128 0, 56 

256 0. 37 

512 0,27 

1024 0. 22 

2048 0. 19 

4096 0. 18 

8192 0. 18 

16384 0.18 


系统 调用 是 需要 时 间 的 ,程序 中 频繁 的 系统 调用 会 降低 程序 的 运行 效率 。 
2.7.2 为 什么 系统 调用 需要 很 多 时 间 
为 什么 系统 调用 会 消耗 很 多 时 间 ? 参见 图 2.5 所 示 的 控制 流程 。 


实 
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2.5 RB IG] 6 5 bd Dic EO 


图 2. 5 中 用 户 进程 位 于 用 户 空间 ,内核 位 于 系统 空间 8E RE EL BÉ CLER BRD. BF 
cpl 要 起 取 磁盘 二 的 数据 只 能 通过 系统 调用 read, iff read 的 代码 在 内 核 中 ,所 以 当 read 调用 
发 生 时 ,执行 权 会 从 用 户 代码 转移 到 内 核 代 码 , 执 行内 核 代码 是 渍 要 时 和 间 的 。 

系统 调用 的 开销 大 不 仅仅 是 因为 要 传输 数据 , 当 运 行内 核 代码 时 ,CPU 工作 在 管理 员 
(supervisor, 又 克 超 级 用 户 ) 模 式 , 这 对 应 于 一 些 特 殊 的 堆栈 和 内 存 环境 ,必须 在 系统 调用 发 
生 时 建立 好 。 系 统 调 用 结束 后 (cead 返回 时 ) ,CPU 要 切换 到 用 户 模式 ,必须 把 堆栈 和 内 人 存 环 
增 恢 复 成 用 户 程 序 运 行 时 的 状态 ,这 种 运行 斌 境 的 切换 要 消耗 很 多 娃 间 。 

当 工 作 在 管理 员 模 式 下 .程序 可 以 直接 访问 破 盘 、. 终端 .打印 机 等 设备 ,还 可 以 访问 全 部 
的 内 存 空 间 . 而 在 有 由 户 模式 ,程序 不 能 直接 访问 没 备 ,也 只 能 沪 问 特定 部 分 的 内 存 空 间 。 在 
运行 时 刻 , 系 统 会 根据 需要 不 断 地 在 两 种 贷 式 间 切 换 。 管 理 员 模式 和 用 户 模式 的 切换 与 
CPU 关系 很 大 ,CPU 中 有 特定 的 标记 来 区 分 当前 的 工作 模式 ,而 Unix &St 9 Hr ETE 
到 CPU 的 这 种 特点 .才能 够 实现 不 同 工 作 模 式 向 的 良好 切换 ，。 

举 个 影片 超人 的 例子 , 当 肯 特 ( 生 活 中 的 趟 人 1) 要 从 用 户 模式 (普通 人 ) 切 换 到 管理 员 模 
KHAN MBSR WA eS RR BIR ARR BRAT 
ARR A BTU xe dS TR MTR MWA. BRERA, BES 
PRAM PERER, ORA Ut EC ET BI SE PESE T, 

在 计算 机 的 世界 中 也 是 一 样 , 要 是 CPU 把 太 多 的 时 间 消 耗 在 执行 内 核 代 吗 和 模式 切换 
上 就 不 可 能 有 很 多时 间 来 执行 程序 中 业务 逻辑 的 代码 或 提供 系统 服务 ,所 以 要 尽 可 能 地 减 
少 模 式 间 的 切换 。 对 系统 来 说 这 种 时 间 上 的 开销 是 昂贵 的 ,那么 who RAE BRIE. BRE 
的 时 间 开 销 有 多 大 呢 ? 


2.7.3 低 效率 的 who2.c 
每 次 从 ump 中 读 出 一 条 记录 ;就 如 同 要 前 3 个 荷包 蛋 ,每 炊 到 超市 去 买 一 个 鸡蛋 ,前 好 





| 
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了 再 去 买 一 个 ,这 是 很 低 效率 的 方法 ,完全 可 以 一 次 把 3 个 鸡蛋 都 买 回来 。 对 于 who 而 言 ， 
可 以 一 次 读 人 多 个 记录 放 在 缓冲 区 中 ,下 面 是 实现 上 述 想 法 的 伪 代 码 : 


getegg( 1 

if ( eggs, left in carton == 0) 
refill carton at store 
if ( eggs at store == 0) 

return EndOfEggs 

} 

edgs left in carton-- ; 

return one eqq; 


} 


getegg 的 每 次 调用 会 从 篮子 里 拿 一 个 鸡蛋 ,而 不 是 每 次 都 要 到 起 市 去 买 , 只 有 当 篮 子 空 
Io AA. 


3 GL /usr/include/stdio. h 中 geic 的 代码 ,getc 的 实现 使 用 了 与 gevegg 类 似 的 算法 。 
2.7.4 在 who2.c 中 运用 缓冲 技术 


在 who2. c 中 加 人 缓冲 机 制 可 以 提高 程序 的 运行 效率 , 接 下 来 要 把 getegg 中 的 想法 用 代 
码 实 现 , 如 图 2.6 所 示 。 


用 utmplib 来 缓冲 
Thain 负数 调用 utmplib, e rp f gg Qc 3: XX 
得 下 一 条 utmp 记录 


utmplib. c 中 定义 的 盖 数 全 次 从 文件 中 这 
取得 6 条 记录 放 人 入 数组 中 


当 数 组 中 的 6 FRAT Se BE i. WU 
内 核 服务 重新 该 到 数据 











图 2.6 FAP 3s fe] S8 48 n A, KES vnb 


用 一 个 能 容纳 16 个 utmp 结构 的 数组 作为 缓冲 区 ,在 图 2. 6 中 标识 为 buffer, 就 像 你 一 
次 会 买 很 多 个 鸡蛋 一 样 buffer 可 以 存放 很 多 数据 。 编写 urmp_next 函数 来 从 缓 串 区 中 取得 
下 一 个 ump 结构 的 数据 。 

BARRERA main ,通过 测 用 utmp_next 来 记得 数据 , 当 缓 冲 区 的 数据 都 被 取出 
后 ,utmp_next 会 商用 read, 通 过 内 核 再 次 获得 16 条 记录 充满 缓冲 区 。 用 这 种 方法 可 以 使 
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read 的 调用 次 数 减 少 到 原来 的 1716. 
以 上 算法 在 utmplib. c 中 天 以 实现 ， 


7 
* 


x utmplib.c - functions to buffer reads from utmp file 


* 

* functions are 

* utmp opent filename ) ^ open file 

* returns — 1 on error 

* utmp next( ) - return painter to next struct 
» returns NULL on eof 

* utmp closet) 一 close file 

x 

* reads NRECS per read and then doles them aut from the buffer 
xj 


# include —-«stdio. hz 


# include «Zfcntl. ho 


# include —|-«sys/types.hz- 
d include <utmp. h> 


it define NRECS 16 
# define NULEUT ((struct utmp * }NULL) 
zt define UTSIZE (sizeof(struct utmp)) 


static char | utmpbuf[ NRECS + UTSIZE]. /* 


static int num recs; /* 


sLatic inl Cur rec: fn 


static int fd utmp = - 1; E 


r 


utmp open( char * filename 》 


1 


fd utmp = opent filename, O RDONLY ); fn 
cur rec = num recs = 0; fs 
return fd utmp; fs 


struct utmp x utmp_next¢) 


{ 


struct utmp * recp; 

if ( fd utmp == -1) ix 
return NULLUT; 

if ( cur rec == num recs && utmp reload() ==0 ) A 
return NULLUT; 


/* get address of next record x/ 


recp = ( struct utmp * ) &utmpbuf[cur rec * UTSIZE]; 
cur rec tt, 


return recp; 


storage x*/ 
num stored «/ 
next to go x, 


read from */ 


open it «/ 
no recs yet «/ 


report af 


error 7 x/ 


any more ? «/ 
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[5 
1 


int utmp reload() 


SR 


x read next bunch of records into buffer 


x! 


J 
i 


int amt read; /* read them in »/ 
amt read = read( fd utmp , utmpbuf, NRECS » UTSIZE }; /* how many did we get? x/ 
num recs = amt read/UTSIZE; /* reset pointer x/ 


cur rec = 0; 


return num recs; 


utmp close() 


{ 


if ( fd_utmp |= -1) /* don't close if not x/ 


close( fd utmp 2; /* open x/ 


utmplib. c 包含 使 用 缓冲 区 所 需 的 变量 和 函数 ,变量 num recs 记录 了 缓冲 区 中 的 数据 
PR, ERB cur rec 记录 了 缓 神 区 中 己 被 使 用 的 数据 的 个 数 ，。 

每 次 要 从 缓冲 区 中 读数 据 前 , 先 检 查 cur_rec 的 值 是 否 等 于 num, recs, MRA SHY € 
冲 区 中 已 经 没有 可 用 数据 了 ,就 调用 read 从 硬盘 上 读数 据 来 填 满 缓 冲 区 ,在 返回 数据 前 , 增 
可 car rec 的 值 。 

函数 utmp_next 返回 指向 结构 的 指针 ,utmplib.c 隐藏 了 实现 细节 ,提供 简单 清晰 的 操 
作 缓 冲 区 的 接口 。 

下 面 是 修改 后 的 main: 


/* who3.c — who with buffered reads 


* - Surpresses empty records 
* - formats time nicely 
* 一 buffers input (using utmplib) 


: 


PY 
H include < stdip, h> 

# include «<sys/ types. h> 
# include <lutmp. h> 

H include «i fentl. h> 


# include «t Line, h> 
# define SHOWHOST 


void show info(struct utmp *); 


void showtime(time t); 
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int main() 
{ 
struct utap « utbufp, /» holds pointer to next rec #/ 


* utmp next(); /* returns pointer to next +/ 


if ( vtmp_open( UTMP. FILE ) == - 1) 
perror(UTMP FILE); 
exit(1); 
| 
while C ( utbufp = utmp next() ) I= ((struct utmp * ) NULL) ) 
shów :nfo( utbufp ); 
utmp closet ); 
return 0; 
} 
/* 
x show info() 


(SECU 69 = ca A AE open , read 和 close 进行 调用 ,而 是 调用 与 之 等 价 的 具有 组 
冲模 式 的 函数 接 只 。 用 于 显示 的 函数 show info 没有 受到 任何 影响 ， 


2.8 内 核 缓冲 技术 
应 用 缓冲 技术 对 提高 系统 的 效率 是 很 明显 的 , 它 的 主要 思想 是 一 次 读 和 大量 的 数据 放 
人 缓冲 区 ,需要 的 时 候 从 缓冲 区 取得 数据 。 
内 核 使 用 缓冲 四 


管理 员 模 式 和 用 户 模 式 之 间 的 切换 需要 消耗 时 间 , 相 比 之 下 , 帮 盘 的 L/O 操作 消耗 的 时 
间 更 多 ,为 了 提高 效率 ,内 核 也 使 用 钥 冲 技术 来 提 尚 对 磁盘 的 访问 速度 ,如 图 2. 7 所 示 。 








ARRIE ( 位 于 系统 空间 ) 


52.7 内 核 缓冲 磁盘 上 的 数据 
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正如 ump 文件 是 用 户 登 录 记 录 的 集合 ,磁盘 是 数据 块 的 集合 ,内 核 会 对 磁盘 上 的 数据 
块 作 缓 冲 ,就 像 who 程序 缓冲 ump 记录 一 样 。 内 核 将 磁盘 上 的 数据 块 复制 到 内 核 缓 冲 区 
中 , 当 一 个 用 户 空间 中 的 进程 要 从 磁盘 上 读数 据 时 , 内核 一 般 不 直接 读 磁盘 ,而 是 将 内 核 组 
冲 反 中 的 数据 复制 到 进程 的 缓冲 区 中 。 

当 进 程 所 要 求 的 数据 块 不 在 内 核 缓冲 区 时 ,内 核 会 把 相应 的 数据 块 加 人 到 清 求 数据 列 
表 中 ,然后 把 该 进程 挂 起 ,接着 为 其 他 进程 服务 。 

一 段 时 间 之 后 (很 短 ) ,内核 把 相应 的 数据 块 从 磁盘 读 到 内 核 缓冲 区 ,然后 再 把 数据 复制 
到 进程 的 缓冲 区 中 ,最 后 唤 瞪 被 挂 起 的 进程 ， 

理解 内 核 缓 冲 技术 的 原理 有 助 于 更 好 地 掌握 系统 调用 read 和 write, read 把 数据 从 内 核 
缓冲 区 复制 到 进程 缓冲 区 ,write 把 数据 从 进程 缓冲 区 复制 到 内 核 缓 冲 区 ,它们 并 椒 等 价 于 数 
据 在 内 以 缓冲 和 磁盘 之 间 的 交换 。 

从 理论 上 讲 ; 内 核 可 以 在任 何 时 候 写 磁盘 ,但 并 人 不 是 所 有 的 write 操作 都 会 导致 由 核 的 
写 动 作 。 内 核 会 把 要 写 的 数据 暂时 存在 绥 冲 区 中 ,积累 到 一 定数 量 后 骨 一 次 写 入 。 有 了 时 会 
导致 意外 情况 ,比如 突然 断 电 ,内 核 还 来 不 及 把 内 核 缓 讲 区 中 的 数据 写 到 磁盘 上 ,这些 更 新 
HF) E SE EA. 

应 用 内 核 缓冲 技术 导致 的 结果 : 

。 提高 磁盘 L/O SOR 
* 优化 磁盘 的 写 操作 
， 需要 及 时 地 将 缓冲 数据 写 人 磁盘 


2.9 文件 读 写 


who 是 从 文件 读数 据 ,cp 从 一 个 文件 读数 括 写 入 到 另 一 个 文件 中 ,会 不 会 有 对 同一 个 文 
件 既 读 又 写 的 情况 呢 ? 


2.9.1 注销 过 程 : 做 了 些 什么 


在 注销 过 程 中 ,系统 改变 了 文件 utmp 中 相应 的 登录 记录 ,从 whol 的 输出 可 以 看 出 文件 
utmp 中 还 包含 那些 末 被 使 用 的 终端 的 信息 ,通过 实验 来 在 这 个 过 程 : 

L 分别 从 两 个 窗口 登录 到 一 个 Unix 系统 中 。 

2. 运行 前 耐 编写 的 whol 程序 来 察看 ump 中 与 你 的 登录 相关 的 两 条 记录 。 注 意 用 来 

cones 

3. 注销 其 中 一 

4. 运行 whol ipe 上 述 两 条 记录 内 容 的 变化 。 

你 会 发 现 其 中 一 条 的 用 户 名 字段 跟 原 来 的 不 同 , 它 的 ut, time 字 眉 的 值 也 发 生 了 改变 。 
在 有 些 系 统 中 ,用 户 名 是 被 清空 的 。 还 请 关心 该 记录 还 有 哪些 改变 ?如 果 蚌 远程 登录 呢 ? 


2.9.2 注销 过 程 : 如 何 工 作 的 
这 其 实 很 简单 ,要 把 用 户 名 清空 AFERI T 
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1. fJ3F Xp ut mp: 
2. M utmp 中 找到 包含 你 所 在 终端 的 登录 记录 ; 
3， 对 当前 记录 做 修改 1; 
:4. 关闭 文件 ， 
下 面 详细 讨论 这 4 个 步 又 。 
1， 打 开 文 件 utmp 
因为 负责 注销 的 程序 必须 对 文件 utmp BEAT KREIS RIPON BMS Ric E 
作 , 所 以 必须 先 打 开 这 个 文件 : 


fd = open(UTMP FILE, O_RDWR); 


2. 从 utmp PRA GORA AR ot BRICK 
这 一 步 很 简单 ,在 while 循环 中 读 取 一 条 utmp 记录 ,将 它 的 at line 字段 跟 你 的 终端 的 
名 字 司 比较, 如果 相等 则 调用 修改 了 哆 数 ， 


while ( read(fd, rec, utmplen) == utmplen) fx get next record x/ 
if ( stromp(rec.ut line, myline) -- 0) /* what, my line? */ 
revise entry(); /* remove my name x/ 


3. 对 当前 记录 做 修改 

负责 注销 的 程序 修改 当前 记录 ,再 把 它 写 四 到 文件 ump 中 。 其 体 来 说 ,要 把 ut_type 
的 值 从 USER, PROCESS 改 成 DEAD PROCESS, 把 ut. time 字段 的 值 疏 为 注销 时 间 , 也 就 
是 当前 时 间 , 有 些 版 本 会 把 用 户 名 和 远程 主机 字段 的 内 容 清空 ,这 些 代 码 编 写 起 来 很 
85. 

tE TREA ACTORS A. MABE CE Micke? 可 以 用 write HE? 不 
fT write 只 会 更 新 下 一 条 记录 ,而 不 是 当前 那 条 要 修改 的 记录 。 因 为 系统 每 次 打开 一 个 文件 
都 会 保存 一 个 指向 文件 当前 位 置 的 指针 , 当 读 写 操作 完成 时 ,指针 会 移 到 下 一 个 记录 位 置 ， 
这 个 指针 与 文件 描述 符 相 关联 。 在 这 种 情况 下 ,指针 是 指向 下 一 条 登录 记录 的 头 一 个 字 节 ， 
这 引出 了 一 个 重要 的 问题 : 

问题 : 在 文件 操作 中 ,如 何 改 变 一 个 文件 的 当前 读 / 写 位 置 ? 

管 题 : 使 用 系统 调用 Iseek. 

4. 关闭 文件 

JB] clase(fd), 


2.9.3 改变 文件 的 当前 位 置 


前 面 讲 过 Unix 每 次 打开 一 个 文件 都 会 保存 一 个 指针 来 记录 文件 的 当前 位 置 , 如 图 2.8 
所 示 。 
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read 从 当前 位 置 恋人 入 指 
党 长 度 的 数据 ,然后 移动 
当前 位 置 指针 , 措 向 下 一 
个 未 读 的 数据 







文件 开始 位 置 


文件 当前 位 置 — 


图 2.8 内 核 为 每 个 行 开 的 文件 保存 一 个 位 置 指针 


当 从 文件 读数 据 时 ,内 核 从 指针 所 标明 的 地 方 开始 , 读 取 指定 的 字 节 ,然后 移动 位 置 指 
针 . 插 向 下 一 个 未 被 读 取 的 字 节 , 写 文件 的 操作 也 是 类 似 的 ， 

指针 是 与 文件 描述 符 相关 联 的 ,而 不 是 与 文件 关联 ,所 以 如 肾 两 个 程序 间 时 打开 一 个 广 
件 , 这 时 会 有 两 个 指针 ,两 个 程序 对 文件 的 读 操作 不 会 下 相干 扰 。 

系统 调用 lseek 可 以 改变 已 打开 文件 的 当前 位 置 ,lseek 的 用 法 如 下 ， 


Leek 
Bt 使 指针 指向 文件 中 的 指定 位 置 
头 文件 5 include <sys/type, h> 
. # include <unistd, hz» 


函数 原型 off_t oldpos = lseek(int fd, off t dist, int base) 


ee id xU ETE: 
dist 35 xj) fr) PE R 
base SEEK, SET => 文件 的 开始 
SEEK CUR => 当前 位 置 
SEEK END => 文件 结尾 


J& [9] (i =i 过 到 错误 
oldpos 指针 变化 前 的 位 置 




















Iseek 改变 文 储 描述 符 所 关联 的 指针 的 位 置 ,新 的 位 置 由 dist 和 base 来 指定 ,base 是 基 
准 位 置 ,dist 是 从 基 北 位 置 开 始 的 仿 移 量 。 基 准 位 置 可 以 是 文件 的 开始 (0) .当前 位 置 (1) 或 
文件 的 结尾 (2)。 如 ; 


lseek( fd, — (sizeof(struct utmp)), SEEK CUP); 
把 指针 往 前 移 一 个 utmp 结构 ,注意 偏 移 量 可 以 是 负 的 。 
lseck(fd, 10 » sizeof(struct utmp), SEEK SET); 
上 述 代码 把 指针 指 到 第 11 个 记录 的 开始 位 置 。 下 面 的 代码 : 


lseek(fd, O, SEEK_END); 
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write(fd, "hello", strien(“hello")); 


使 指针 指 到 文件 的 末尾 , 接 下 来 写 一 个 字符 串 到 文件 中 。 
最 后 要 说 明 的 是 ,lseek(fd, 0, SEEK_CUR) 返 回 指针 所 指向 的 当前 位 置 。 


2.9.4 编写 终端 注销 的 代码 
利用 上 述 知识 就 可 以 编写 一 个 函数 对 注销 的 的 用 户 修改 utmp 中 相应 的 记录 : 


了 

* logout tty(char x» line) 

* marks a utmp record as logged out 

* does not blank username or remote host 
* return — 1 on error, Ü on success 

*/ 

int logout tty(char * line) 

{ 


int fd: 

struct utmp rec; 

int len = sizeofistruct utmp); 

int retval = - 1; /* pessimism */ 

if (( fd = open(UTMP FILE,O RDWR)) == -1) /* open file x/ 
return - 1; 


/* search and replace */ 


while (read(fd, &rec, len) == len?) 
if (strnempírec.ut line, line, sizeof(rec.ut line)) == 0) 
{ 
rec.ut_type = DEAD PROCESS; /* set type «/ 
if (time(&rec.uL time !- - 1)? /* and time «/ 
if ( lseek(fd, - len, SEEK CUR)!* ~1) /# back up */ 
it (write(fd, &rec, len) == len) /* update »/ 
retval = 0; /* success! »*/ 
break; 


} 

/* close the file «/ 

if (close(fd) == - 10D 
retval = -1; 


return retval; 


} 


上 述 这 段 代码 对 每 个 系统 调用 都 有 出 错 处 理 ,这 是 很 有 必要 的 ,因为 这 个 程序 需要 修改 
一 些 重 要 的 系统 配置 文件 ,如 果 这 些 文件 的 内 容 遭 到 破坏 , 那 系统 就 会 遇 到 麻烦 。 实 际 上 ， 
这 本 书 中 不 是 所 有 的 地 方 都 有 很 完善 的 出 错 处 理 , 这 并 不 表示 出 错 处 理 不 重要 ,而 是 为 了 使 
程序 更 加 清晰 易 懂 。 
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接 下 来 看 一 看 出 错 处 理 与 报答 。 


2.10 处理 系统 调用 中 的 错误 


如 果 open 无 法 打开 指定 的 文件 , 它 会 返回 一 1。 同 样 地 , 当 read 无 法 读 的 时 候 , CSR 
回 一 1, 当 lseek 无 法 指定 指针 位 置 时 , 它 也 会 返回 一 1, 一 1 是 表示 在 系统 调用 中 出 了 些 问题 ， 
调用 者 每 次 都 必须 检查 返回 值 ,一 旦 检测 到 错误 ,必须 栓 出 相应 的 处 理 ， 

ARS RSPR? 每 个 系统 调用 都 有 自己 的 错误 集 , 以 open 为 例 , 如 果 要 打 
开 的 文件 不 存在 ;或 者 虽然 存在 ,但 没有 读 的 权限 ,或 者 已 经 打开 的 文件 太 多 ,都 会 导致 系统 
报错 。 如 何 来 确定 发 生 了 哪 一 和 社 错 误 呢 ? 

1. 确定 错误 的 种 类 :errno 

内 核 通过 全 局 变量 errno 米 指明 错误 的 类 型 ,每 个 程序 都 可 以 访问 到 这 个 变量 ，。 

在 error(3) 的 联机 帮助 和 <etrtno.h> 中 包含 错误 代 公 和 相应 的 说 明 , 以 下 是 一 些 例 子 ， 





{define EPERM 
# define ENOENT 


/* Operation not permitted «/ 


/* No such file or directory */ 


d define EINIR 
tHdefine EIQ 


1 
2 
+#define ESRCH 3 /x No such process */ 
4 /* InLerrupted system call »/ 
5 


/* I/O error «/ 


2. 不 同 的 错误 需要 不 同 的 处 理 
根据 以 上 将 出 的 错误 类 型 ,在 程序 中 进行 相 庶 的 处 理 : 


# include < errno, h> 
extern int errno; 
int sample() 


{ 


int fd; 
fd = opent "file", O_RDONLY)- 
if (fd == -1) 


i 
printf "Cannot open file; "); 
if ( errno == ENDENT ) 
pritnf("There is no such file. "}; 
else if ( errno == EINTR } 
printf( “Interrupted while opening file. "}; 
else if ( errna == EACCESS ) 


printf("You do not have permission to open file. "); 


需要 根据 不 同 的 错误 类 型 做 不 同 的 错误 处 理 。 如 果 要 打 井 的 文件 不 存在 ,那么 给 出 提 
示 重 新 输 人 文件 名 ,如 果 已 经 打开 的 文件 太 多 , 那 就 关闭 一 些 不 需要 的 文件 ,这 种 情况 是 不 
需要 给 用 户 任 何 提示 的 。 
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3. ETA E. perror(3) 
在 需要 得 示 出 错误 信息 的 时 候 ; 可 以 根据 不 同 的 错误 代码 打印 相应 的 字符 捉 , 上 面 的 例 
了 sample() 就 是 这 样 做 的 ,另外 一 种 更 简 使 的 方法 是 用 perror(string) KT BRM. ESA 


查找 错误 代码 ,在 标准 错误 输出 中 显示 出 相应 的 错误 信息 ,参数 string 是 要 同时 显示 出 的 措 
述 性 信息 。 


应 用 了 perror 的 sample; 
int sample} 


{ 
int fd; 


fd = open("file", O RDONLY);. 
if (fd == -1) 
{ 


perror("Cannot open file"); 


return; 


当 有 错误 发 生 时 ,可 能 会 看 到 如 下 的 信息 : 


Cannot open file; No such file or directory 
Cannot open file: Interrupted system cali 


显示 的 第 一 部 分 是 用 户 传递 进去 的 描述 性 信息 ,第 二 部 分 是 根据 错 谋 代码 查 到 的 错误 


小 结 


1 主要 内 容 


.* who 命令 通过 读 系 统 日 志 的 内 容 显 示 当 前 已 经 登录 的 用 户 。 
* Unix 系统 把 数据 存放 在 文件 中 ,可 以 通过 以 下 系统 调用 操作 文件 ; 


open( filename, how) 





creat(filename, mode? 
read(fd, buffer, amt) 
write(fd, buffer, amt) 
lseek(fd, distance, base) 
closet fd) 


。 HERRAS PE i / SAR SEOCPER XB TE RFR RR XAR E E. 
。 每 次 系统 调用 都 会 导致 用 户 模式 和 内 核 模式 的 切换 以 及 执行 内 核 代码 ,所 以 减少 程 
序 中 的 系统 调用 发 生 的 次 数 可 以 提高 程序 的 运行 效率 。 


。 程序 可 以 通过 缓冲 技术 来 减少 系统 调用 的 次 数 , 仅 当 写 缓冲 区 注 或 读 缓冲 区 空 时 才 
调用 内 核 服务 ， 
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* Unix 内 和 核 可 以 通过 内 核 缓 冲 来 减少 访问 磁盘 L/O 的 次 数 。 

* Unix 中 时 间 的 处 理 方 式 是 记录 从 某 一 个 时 间 开 始 经 过 的 秒 数 。 

- 当 系 统 调 用 出 错时 会 把 全 局 变量 errno 的 值 设 为 相应 的 错误 代码 ,然后 返回 一 1, 程 
序 可 以 通过 检查 errno 来 确定 错误 的 类 型 ,并 采取 相应 的 措施 。 

。 这 一 章 涉及 的 知识 在 系统 中 都 可 以 找到 ,联机 帮助 中 有 命令 的 说 明 , 有 些 还 会 涉及 命 
令 的 实现 , 头 文件 中 有 结 梅 和 系统 常量 的 定义 ,还 有 冰 数 原型 的 说 明 。 


2. 
2.1 


2.2 


2.3 


2.4 


Z. 6 


习题 


在 Unix 中 有 一个 w 命令 ,这 个 命令 与 who 有 关 , 运 行 这 个 命令 ,并 阅读 它 的 联机 
帮助 , 找 出 它 提供 了 哪些 who 没有 提供 的 信息 ? 其 中 有 哪些 信息 来 自 utmp 这 个 
文件 ? 这 些 信息 各 是 什么 含义 ?其 他 信息 来 自 哪里 ? 


用 户 登 录 的 了 时候, 登录 信息 会 被 记录 在 utmp 文件 中 ,在 注销 的 时 候 , 文件 中 相应 
的 记录 会 被 删除 。 如 内 用 户 正在 使 用 系统 的 时 候 ,系统 突然 出 澳 , 很 明显 ,这 时 候 
utmp 文件 的 内 容 会 有 问题 ,在 系统 重新 启动 的 时 候 , 会 对 utmb fif] A Rb ud 
系统 会 不 会 重新 为 每 一 条 可 用 终端 建立 记录 ? 查阅 相关 的 联机 帮助 和 头 文件 ,以 
及 启动 脚本 , 米 找 出 上 述 问题 的 答案 ,可 以 在 自己 的 机 器 上 做 实验 来 验证 自己 的 


做 个 实验 ,把 一 个 文件 复制 到 /dev/tty: epl epl. e /dev/tty。 这 时 复制 的 日 标 文 
件 是 一 个 终端 。 对 终端 的 读 写 操 作 与 对 一 个 普通 文件 进行 读 写 是 一 样 的 。 接 下 
来 做 实验 ,从 终端 读 , 这 时 会 从 键盘 读 字 符 , 然 后 写 人 到 文件 中 ,输入 是 以 回 车 十 
<Cul-D> fe HA RSE 


标准 C RAIAN fopen.getc fclose. fgets 的 实现 都 包含 内 核 级 的 缓冲 .它们 用 到 了 
一 个 结构 FILE, 并 以 此 为 基础 构造 了 类 似 utmplib 的 中 间 层 ,在 头 文件 中 找到 结 
构 FILE 的 成 员 措 述 , 将 其 与 utmplib. c 中 的 变量 做 比较 。 


每 么 来 确定 数据 已 经 被 写 到 磁盘 上 (不 是 被 缓冲 )? 采用 缓冲 技术 时 ,内 核 会 把 要 
写 人 磁盘 的 数据 放 在 缓冲 区 ,然后 在 它 认 为 合适 的 时 候 写 人 人 磁盘。 阅读 相应 的 联 
机 帮助 ,找到 能 够 确定 地 把 数据 写 人 磁盘 的 方法 ， 


Unix 允许 一 个 文件 同时 被 多 个 进程 打开 ,也 允许 一 个 进程 同时 打开 好 几 个 文件 ， 
做 多 次 打开 文件 的 实验 : 

OO 以 读 的 方式 打开 文件 

《2) 以 写 的 方式 打开 文件 

(3) 再 次 以 读 的 方式 打开 文件 

这 时 有 3 个 文件 描述 符 , 接 下 来 : 

(4) 从 第 一 个 文件 描述 符 5( 以 下 简称 {d) 中 读 20 字 节 ,显示 读 到 的 内 容 。 

(5) Mt fd SA“ testing 123-7, 

(6) 从 第 二 个 id EH 20 字 节 ,最 示 读 到 的 内 容 。 
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2.7 


2.8 


2.9 


联机 帮助 man 中 可 以 查 到 关于 命令 .系统 调用 .系统 设备 等 帮助 信息 ,如 何 才能 了 
S man 的 使 用 方法 ? 在 你 的 系统 中 ,man 分 为 几 个 小 节 ? 它们 分 别 是 人 守 么 ? 


本 章 提 到 文件 utmp 中 还 包 全 了 一 些 记 录 , 它 们 与 己 登 录用 户 的 信息 无 关 , 那 么 它 
们 存放 的 是 什么 ” 各 代表 什么 含义 ? 


lseek 可 以 将 文件 指针 移动 文件 的 末尾 以 后 ,如 ， 

lseek(fd, 100, SEEK END) 

将 指针 移 到 文件 末尾 再 往 后 100 个 字 节 的 地 方 。 如 打从 文件 末尾 以 后 100 个 字 节 
的 他方 开 始 读 会 呈现 什么 情况 ?如 果 从 文件 末尾 以 后 100 个 字 节 的 地 方 开 始 写 会 
出 现 什么 情况 ? 从 100 字 节 增加 到 20000 字 凶 ,再 写 人 “hello” 和 着 看 会 有 什么 结 玉 ， 
Fl ls -1 米 检查 文件 的 长 度 , 上 骨 用 ls ~s 试 试 。 


3. 编程 练习 


2. 10 


2.13 


2.14 


从 who 的 联机 帮助 中 可 以 知道 who am i 也 是 可 以 接受 的 形式 ,同样 还 有 
whoami , f£ tr who2. c. fiit E Hg who ami 的 形式 。 阅读 whoami 的 联机 帮助 ,看 
它 与 who 有 什么 不 同 ,编程 实现 whoami。 


使 用 标准 cp 命令 时 , 当 原 文件 和 目标 文件 相同 时 ,会 有 什么 结果 ? 修改 who?. c 
使 之 能 够 处 理 这 种 情况 。 


在 utmplib. c PHILP BREA TRA utmp 文件 的 读 写 效率 ,调用 这 些 函 数 , 每 
次 返回 一 个 utmp 记录 ;有 时 返回 的 记录 中 可 能 不 包含 任何 有 用 的 信息 ,修改 
utmplib. c ,使 每 次 返回 的 部 是 有 用 的 信息 。 这 样 修 会 影响 到 who3. c 其 他 部 分 
的 代码 吗 ? 为 什么 ? 


PRX logout tty Of H] lseek 往 前 移动 指针 ,以 便 重 写 当前 记录 ,注意 在 这 个 函数 
中 没有 计 到 缓冲 技术 ,如 果 使 用 缓冲 可 以 提 商 称 序 的 运行 效率 。 
(D) 如 果 在 logout tty O rp HRS utmplib.c 中 的 函数 会 产生 什么 问题 ? 
(2) 在 utmplib. c 中 增加 一 个 函数 : 

utmp seek(record offset, base) 
改变 当前 指针 的 位 置 , record offset E E $E zi 69 (s EE E. hase 可 以 是 SEEK 
SET,CEEK CUR 或 SEEK_FND, 注 意 偏 移 量 每 增加 1, 表 示 要 移动 sizeof 
(struct ump) WSF. 
(3) 修改 logout. tty O 以便 能 够 使 用 utmplib. c 中 的 图 数 。 


whol 可 以 显示 出 utmp 中 的 每 条 记录 ,虽然 这 不 是 原来 想 要 的 功能 ,但 却 提供 了 
一 个 工具 ,以 使 能 够 检查 utmp 文件 内 容 的 变化 。utmp 记录 中 的 at type 字段 很 
有 有 几 ,修改 whol 使 之 能 够 显示 ump 记录 的 所 有 字段 ,进一步 修改 使 whol 能 够 
通过 参数 指定 要 读 取 的 文件 ,这 样 就 可 以 用 whol KRA XIE wimp HAR. 


标准 的 cp 会 自动 禾 盖 已 经 存在 的 文件 ,而 不 给 出 任何 提示 ,如 已经 存在 了 一 个 文 
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ft file2, 又 输入 : 

5 cp filel file2 
SHH file2 的 内 容 。 标 准 的 cp 有 一 个 参数 -i 可 以 在 覆盖 前 给 出 提示 ,得 到 确认 
RAR. 修改 cpl.c 使 之 也 具有 上 述 特性 。 


4， 项 目 
根据 本 章 所 学 的 内 容 , 编写 以 下 的 Unix RI: 
ac, last, cat, head, tail, od, dd 

5. 最 后 一 个 问题 : tail 命令 

这 一 章 通 过 分 析 几 个 命令 已 经 学 到 了 很 多 知识 ,最 后 还 有 一 个 命令 tal 请 读者 来 分 析 。 

lseek 命令 可 以 移动 指针 ,lseek(f4;, 0, SEEK_KEND) 可 以 使 指针 移 到 文件 的 末尾 ， 

tail 命令 显示 出 文件 末尾 指定 行 数 的 内 容 , 所 以 ,tail 必须 能 够 找到 文件 中 一 个 指定 的 地 
TETERE. 

MM REC? 开动 脑筋 好 好 想 想 , 注 意 用 缓冲 技术 来 提高 效率 、 阅 读 联机 帮助 看 
A tail AMHR BME NRC. 

本 书 的 网站 上 有 商 个 版 本 的 tail 的 源 代 码 ,其 中 一 个 是 GNU 版 本 的 ,另外 一 个 是 BSD 
版 本 的 ;它们 用 了 完全 不 同 的 思路 , 却 都 实现 得 很 好 ,最 好 先 自己 写 ,然后 再 参考 它们 的 实现 。 
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概念 与 技巧 

。 目录 是 文件 的 列表 

。 如 何 读 取 目录 的 内 容 

e 文件 类 型 以 及 如 何 知道 文件 的 类 型 
© 文件 属性 以 及 如 何 知道 文件 的 属性 
， 位 操作 及 掩 码 的 使 用 

> 用户 与 组 ID 及 passwd 数据 库 
相关 系统 调用 与 函数 

* opendir , readdir,closedir.seekdir 
* stat 

e chmod,chown utime 

* rename 

相关 命令 


。 js 
3.1 f 绍 


已 经 介绍 了 如 何 读 / 写 文件 内 容 的 方法 。 除 了 内 容 之 外 ,文件 还 有 很 多 属性 ,比如 文件 
所 有 者 、 最 后 修改 时 间 文件 大 小 、 类 型 等 。 文件 名 在 目录 中 列 出 ,正如 电话 号 码 簿 中 列 有 人 
名 一 样 。 如何 恋歌 文件 名 和 文件 的 属性 呢 ? 

Is 命令 可 以 列 出 目录 中 所 有 文件 的 名 字 , 以 及 这 些 文件 的 其 他 信息 。 本 章 通过 分 析 Is 
命令 来 学 习 目 录 和 和 文件 的 类 型 与 属性 ， 


3.2 问题 1: ls 命令 能 做 什么 


3.2.1 Is 可 以 列 出 文件 名 和 文件 的 访 性 
在 命令 行 输入 ls: 
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S ls 
Makefile docs  ls2.c s.tar statdemo.c taill.c 
chapQ3 lsi.e old src stati.c taill 
$ 


ls 的 默认 动作 是 找 出 妆 前 目录 中 所 有 文件 的 文件 名 , 按 字典 序 排序 后 输出 。 有 些 版 本 的 
ls 默认 会 分 栏 输出 ,有些 需要 参数 -C 才 这 样 做 。 
ls 还 能 显示 其 他 的 信息 ,如 果 加 上 -1 选项 ,ls 会 列 出 每 个 文件 的 详细 信息 ,也 叫 1s 的 长 


格式 : 
5 is-1 
total 104 
-rw-rw-r-— 2 bruce users 345 Jul 29 11:05 Makefile 
-r4-rw-r-— 1 bruce users 27521 Aug 1 12:14 chap03 
drwxrwxr-x 2 bruce users 1024 Aug 1 12;15 docs 
-rw-r--r-- 1 bruce users 723 Feb 9 1998 lsl.c 
-rw-r--t-— 1 bruce users 3045 Feb 15 03:51 1s2.c 
drwxrwxr-x 2 bruce users 1024 Aug ł 12;14 old src 
-rw-rw«—r-- I bruce users 30720 Aug 1 12,05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15 statl.c 
-rw-r--r-- 1 bruce support 191 Feb 9 1998 statdemo.c 
-rwxrwxr-x 1 ‘bruce users 37351 Aug 1 12:13 taill 
-rw-r--r-- 1 bruce users 1426 hug 1 12:05 taill.c 
$ 


每 一 行 代表 一 个 文件 和 它 的 多 个 属性 。 


3.2.2 列 出 指定 目录 或 文件 的 信息 


一 个 Unix 系统 中 会 有 很 多 的 目录 ,每 个 目录 中 又 会 有 很 多 文件 。 如 果 要 列 出 一 个 


非 当 前 目录 的 内 容 或 者 是 一 个 特定 文件 的 信息 , 则 需要 在 参数 中 给 出 目录 名 或 文件 名 。 


Abs WHE E REEL A HX H 
例 于 说 上 明 

















ls /tmp Wy 列 出 /tmp 目录 中 各 文件 的 文件 和 名 
Is -1 docs 3i ij docs 目录 中 各 文件 的 属性 
Is -1.. /Makefile 显示 文件 ., (Makefile 的 属性 

Is *.c 显示 与 *.c 匹配 的 文件 


好 果 参数 是 目录 ,is 列 出 自 录 的 内 容 , 如 果 参 数 是 文件 ,is 列 出 文件 名 和 属性 .所 给 的 命 


令 行 选 项 在 很 大 程度 上 决定 了 ls 的 输出 内 容 。 
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3.2.3 经 常用 到 的 命令 行 选 项 











A $ 说  H 

Is -a Fl sh AY AS A La PE 
ls - lu 显示 最 后 访问 时 间 

ls -s 显示 以 块 为 单位 的 文件 天 小 

Is -t 输出 时 按时 间 排 序 


ls -F 显示 文件 类 型 


如 果 对 Unix 不 是 很 熟悉 ,那么 可 能 需要 解释 一 下 -a 这 个 选项 ,在 Unix 中 ,ls 一 般 不 会 
列 出 以 “, ?开始 的 文件 ,所 以 可 以 把 这 样 的 文件 看 作 是 隐藏 文件 ls 加 上 了 -a 以 后 ,过 到 这 
样 的 文件 也 必须 把 它 列 出 来 。 对 操作 系统 (例如 内 核 ) 面 言 ,文件 各 前 面 的 “. "没有 任何 特殊 
的 含义 , 它 只 对 ls 的 使 用 者 有 意义 。 

某 些 应 用 程序 的 配置 文件 是 位 于 用 户 的 主 目录 于 以 “. ”开始 的 某 个 文件 ,这 是 由 习惯 形 
成 的 ,因为 在 大 多 数 情况 下 可 以 将 它们 隐藏 。 但 是 需要 时 可 以 直接 被 打开 编辑 ,不 需要 任何 
特殊 的 操作 . 


3.2.4 问题 1 的 答案 


通过 实验 和 联机 帮助 可 以 知道 ls 做 了 以 下 两 件 事 : 

， 列 出 目录 的 内 容 

。 显示 文件 的 信息 

注意 ls 对 文件 和 目录 所 做 的 操作 是 不 同 的 。ls 能 判定 参数 指定 的 是 文件 还 是 目录 。 这 
MN RA? 如 果 要 自己 写 一 个 ls, 以 下 三 点 是 殉 要 掌握 的 ， 

- 如 何 列 出 目录 的 内 容 

“ 如 何 读 取 并 显示 文件 的 属性 

， 给 出 一 个 名 字 , 如 何 能 够 判断 出 它 是 目录 还 是 文件 


3.3 x fF hi 


在 开始 之 前 , 先 来 看 看 Unix 是 如 何 组 织 磁盘 上 的 文件 的 。 
磁盘 上 的 文件 和 目录 被 组 成 一 则 昌 录 树 ,每 个 节点 都 是 目录 或 文件 ,如 图 3. 1 BER. 








图 3.1 HHRHH 
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图 3. 1 中 的 大 方 框 表示 目录 .大方 框 内 的 小 方 框 贿 示 文件 ,目录 之 间 的 连 线 表 示 上 月 录 之 
间 的 组 织 关 系 。 

在 Unix 系统 中 ,每 个 文件 都 位 于 基 个 目录 中 ,在 乾 辑 上 是 没有 号 动 器 或 着 的 ,当然 在 物 
理 上 一 个 系统 可 以 有 多 个 驱动 器 或 分 区 ,每 个 驱动 器 上 都 可 以 有 分 区 ,位 于 不 同 驱动 器 和 分 
区 上 的 目录 通过 文件 树 无 链 地 连接 在 一 起 ,甚至 软盘 .光盘 这 些 移动 存 情 介质 也 被 挂 到 文件 


树 的 某 一 -个 子 目录 来 处 理 。 
这 些 使 ls 的 实现 极为 简单 ,只 需 考 菩 文件 和 目录 两 种 情况 ,而 无 需 考虑 驱动 从 或 分 区 。 


3.4 问题 2: Is 是 如 何 工 作 的 


ls 产生 一 个 文件 名 的 列表 , 它 大 臻 是 这 样 工作 的 ， 


open directory 
* read entry - end of dir? -+ 
_ display file info 


close directory Acca Emme * 


ERERS who 的 十 分 相似 ,主要 的 区 别 是 who 从 文件 中 读数 据 , 而 ls 从 目录 中 读数 
据 , 读 目录 与 读 文 件 区 别 大 吗 ? 目录 到 底 是 什么 呢 ? 


3.4.1 什么 是 目录 


先 来 着 一 看 什么 是 目录 。 目 录 是 一 种 特殊 的 文件 , 它 的 内 容 是 文件 和 目录 的 名 字 。 从 
某 种 程度 上 说 ,目录 文件 与 上 一 章 讲 的 utmp 文件 很 类 似 。 它 们 都 包含 很 多 记录 ,每 个 记录 
的 格式 由 统一 的 标准 定义 。 每 条 记录 的 内 容 代 表 一 个 文件 或 月 录 。 

与 普通 文件 不 同 的 是 .目录 文件 永远 不 会 空 ,每 个 日 录 才 至 少 包 含 两 个 特 吻 的 项 一 一 


3.4.2 是 否 可 以 用 open.read 和 close 来 操作 目录 
通过 以 下 实验 来 看 日 录 文 件 的 内 容 ; 


$ cat / 
88'.a2'asa..a'bw. tagsb'c{ 
quota. userc'| 
quota. group'esbetce' 'sbtmp' "sbdev" sbmnt ' wcsbin '2 
sbopt2 
9 
sbusr8 
1g 
sbvarg 


(many lines of bard- to- read data omitted) 


S more /tmp 
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{tmp is a directory 


$ od -c /dev 
0000000 360 001 \O \O 024 \o 001 AO . 0 \O X0 360 001 XO X0 
0000020 001 200 XO XO 002 XO XO X0 024 X0 002 “0 F . «06 0 


0000040 002 X06 X0 \O 001 200 \O 0 361 001 X0 XO 030 X0 Xa 0 
0000060 M A K E D E V \Q 361 001 X0 XO 001 200 XO X9 
0000100 362 001 XO XO 030 XO 004 NO k 1 o g WO XO XO \0 
0000120 362 001 X0 0 001 200 \a 0 363 001 XO V0 030 \0 004 WO 
0000140 k co o n X0 X0 XO 0 363 001 XO \O 001 200 X0 0 
6000160 364 001 XO X0 030 XO \a \O k b i n 1 o g D 
0000200 364 001 X0 \0 001 200 X0 X0 365 001 \O \o 030 X0 O04 \ù 
0000220 k m e m X) O0 XO 0 365 001 AO MO 001 200 XO NO 
0000240 366 001 X0 \0 024 “0 003 XO m e m \0 366 001 XO NANO 


从 以 上 的 例子 中 可 以 发 再 3 点 ,第 一 ,cat Mood 可 以 打开 目录 。 因 为 cat 和 od 使 用 的 是 
标准 的 文件 操作 系统 调用 ,所 以 目录 可 以 被 open,read,close 打开 ;第 二 ,more 可 以 区 分 出 文 
件 和 电 录 , 它 拒绝 对 目录 进行 操作 ,有 些 版 本 的 cat 和 more 一 样 拒绝 显示 目录 内 容 ; 第 二 ,从 
以 上 列 出 的 目录 内 容 可 以 知道 ,目录 内 不 是 无 格式 的 文本 而 是 包含 一 定 的 数据 结构 。 

实际 上 用 open. read close 这些 系统 调用 来 操作 绅 录 并 不 是 很 好 的 方法 ,Unix 支持 多 种 
的 目录 类 型 ,有 Apple HFS.1809860, VFAT,NFS 等 ,如 果 用 read 来 读 ; 那 么 需要 了 和 解 这 些 
不 同类 型 月 录 各 自 的 结构 细节 。 


3.4.3 ”如何 读 目录 的 内 容 
什么 孙 数 可 以 污 目 录 呢 ”在 联机 帮助 中 根据 关键 字 direct KERER.: 


$ man - k direct 


我 所 用 的 系统 返回 了 81 条 主题 ,用 grep 滤 出 那些 包含 read 的 主题 ， 


$ man -k direct grep read 
DXmtelpSystemDisplay (3X) - Displays a topic or directory of the help file in Bookreader. 
opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir(3) -- Performs operations 


on directories 


S "h 
其 中 的 readdir ERAEN. KEE HELA H: 


5 man 3 readdir 


opendir( 3} opendir(3) 
NAME 


opendir, readdir, readdir_r, telldir, seekdir, rewinddir, closedir - 


Performs operations on directories 
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LIBRARY 


Standard € Library (libe. a) 
SYNOPSIS 


# include <sys/types.h> 
4 include <dirent. h> 


DIR x opendir(const char * dir name); 

struct dirent x readdir(DIR x dir pointer); 

int readdir r(DIR « dir pointer, struct dirent * entry, 
struct dirent #* result); 

long telldir(DIR + dir, pointer); 

void seekdir(DIR » dir pointer, long location ); 

void rewinddir(DIR * dir pointer); 

int closedir(DIR 4 dir, pointer); 

[more] (11*) 


通过 联机 帮助 可 以 知道 ,从 目录 读数 据 与 从 文件 读数 据 是 类 似 的 ,opendir 打开 一 个 县 
录 ,readdir 返回 目录 中 的 当前 项 ,closedir 关闭 一 个 目录 ,seekdir. Lejldir、rewinddir 与 lseek 
的 功能 类 似 , 如 图 3.2 所 示 。 


struct dirent 


opendir(char » ) 
creates a connection, 
returns à DIR a 


readdiy (DIR =) 
reads next records, 
returns a pointer 


to a struct dirent 


closedir (DIR =) 


closes a connection 





图 3.2 从 且 录 中 污 到 一 项 


目录 是 文件 的 列表 ,更 确切 地 说 ,是 记录 的 序列 ,每 条 记录 对 应 一 个 文件 或 子 目 录 。 通 
过 readdir 来 读 取 目录 中 的 记录 ,readdir 返回 一 个 指向 目录 的 当前 记录 的 指针 ,记录 的 类 型 
是 struct dirent ,这 个 结构 定义 在 /usr/inctude/dirent. h 中 ,联机 帮助 中 也 可 以 查 到 。 

在 SunOS 中 关于 它 的 帮助 信息 如 下 : 


File Formats dirent(4) 


NAME 


dirent - file system independent directory entry 
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SYNOPSIS 
# include «dirent. h> 


DESCRIPTION 
Different file system types may have different directory entries. The dirent structure 
defines a file system independent directory entry, which contains information common to 
directory entries in different file system types. A set of these structures is returned by 


the getdents(2) system cell. 
The dirent structure is defined: 


struct dirent | 
ino t d ing; 
off t d off; 
unsigned short d reclen; 
char d name[(1]7; 
Hh 


dirent 结构 中 成 员 d. name 用 于 存放 文件 名 。 广 意 在 此 系统 中 d. name 被 定义 为 只 有 一 
^r ZUR BO EAR. ,这 如 何 能 做 到 呢 ? 因为 一 个 字符 的 空间 只 能 存放 字符 串 的 结束 符 。 


3.5 问题 3: 如 何 编写 Ts 


main() 
opendir 
while ( readdir ) 
print d name 


closedir 


SLE ACA On F: 


/** lsi.c 
** purpose list contents of directory or directories 
** action if no args, use. else list files in args 
xx, 

# include «—stdio. h> 

# include <‘sys/types. h> 

# include < dirent. h> 


void do ls(char []); 


maintint ac, char »*»av[ ]) 





Q 译 者 注 ; XT d name 3E X UNIX 的 各 个 版 本 稍 有 不 同 , 丰 Linux 中 是 char d name [NAME MAX 1], 


70 。 Unix/Linux 编程 实践 教程 








if (ac == 1) 
do lst "," }; 
else 
while ( —-- ac 21 
printf("$ s;Án", x tav); 


do ls( * av); 


} 


void do ls( char dirname[ | ) 

is 
* list files in directory called dirname 
xf 


{ 
DIR *dir ptr; /* the directory s/ 


struct dirent x direntp; /* each entry */ 


if { (dir ptr = opendir( dirname } ) == NULL) 
fprintf(stderr,"1s1; cannot open % s\n", dirname); 
else 
{ 
while ( ( direntp = readdir( dir ptr ) ) | = NULL} 
printf(" $$ s\n", direntp —>d_name ); 


closedir(dir ptr); 


将 上 述 代 码 编译 运行 ,并 将 输出 与 标准 的 ls 的 输出 做 比较 : 


$ ce -o ls1 lsl.c 
$ lal 


s. tar 
taill 
Makefile 
lsi.c 
1s2.c 
chap03 
old src 
docs 

Is] 
statl.c 
statdemo.«c 
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taill.c 


S ls 

Makefile docs Jlsl.c old src  statl.c taill 
chap ls1 1s2.C s. tar statdemo.c taill.c 
$ 


还 能 做 什么 


看 来 ls 的 第 一 个 版 本 还 不 错 , 但 是 以 下 功能 还 需要 加 进去 。 

(1) 排序 

ls] 的 输出 没有 经 过 排序 ,解决 办 法 ; 把 所 有 的 文件 名 读 入 一 个 数组 ,用 qsort en CIPUE 
组 排序 。 

(2) 分 栏 

标准 的 ls 的 输出 是 分 栏 排列 的 ,有 些 以 行 排序 输出 ,有 些 以 列 排 序 输 出 。 解 决 水 法 : 先 
把 文件 名 读 人 数组 ,然后 计算 出 列 的 宽度 和 行 数 。 

(3) *. ”文件 

isl 9j Hi T *. ”文件 ,而 标准 的 ls 只 有 在 给 出 -a 选项 时 才 会 列 出 这 些 文件 。 解 决 办 法 ，; 
使 1s1 能 够 接收 选项 -a, 并 在 没有 -a UA RA Eos ERE. 

(42 选项 -1 

如 果 选 项 里 有 -1, 标 准 的 ls 会 列 出 文件 的 详细 信息 ,而 isl 不 会 。 解 决 办 法 ; 要 解决 这 
个 间 题 不 是 太 容 易 , 因 为 dirent 结构 中 没有 提供 所 需要 的 信息 ,如 文件 大 小 ,文件 所 有 者 等 。 
如 果 文 件 的 这 些 信 息 不 是 存储 在 目录 中 ,那么 它们 会 存 情 在 什么 厚 方 呢 ? 


3.6 编写 Is -1 


ls 要 做 两 件 事情 ,一 是 列 出 目录 的 内 容 , 二 是 显示 文件 的 详细 信息 ,这 实际 上 是 两 件 不 同 
的 工作 ,目录 包含 文件 名 ,文件 信息 则 需要 从 另外 的 途径 获得 , 接 下 来 从 3 个 问题 人 手 , 来 解 
决 文件 信息 显示 的 问题 。 


3.6.1 问题 1: ls -1 能 做 些 什 么 


先 来 看 1s -1 的 输出 ， 

5 1s -1 

total 108 

-rw-rw-r-- 2 bruce users 345 dul 29 11:05 Makefile 
-rW-rw-r-- 1 bruce Users 27521 Aug 1 12:14 chap03 
drwxrwxr-x 2 bruce Users 1024 Aug 1 .12;15 docs 
-rw-r-—r-- 1 bruce Users 723 Feb 9 1998  lsl.c 
-rw-r--r-- 1 bruce Users 3045 Feb 15 03:51 Is2.c 
drwxrwxr-x 2 bruce Users 1024 kug 1 12:14 old src 
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-FW-rW-I-- bruce 


-YWw-r--r-- bruce 


—YWXIWXI-X bruce 


bruce 


1 

1 
-rW E-r- 1 bruce 

1 

after ocr 1 

i 


一 kW 一 工 一 一 工 一 一 


$ 


ST Maa TTXE 
ist mode) 


链接 数 (links) 


文件 所 有 者 (owner) 
#4 (group) 
大 小 (size) 


最 后 收 改 时 间 
(last - modified) 


文件 名 (name) 


cse215 cscie215 574 Feb 


(mi 


Users 30720 Aug 1 12:05 s.tar 

support 946 Feb 18 17:15  statl.c 

support 191 Feb a 1998  statdemo.c 

Users 37351 Aug 1 12;13 taill 

Users 1416 Aug 1 12:05  taill.c 
9 


1998  writable.c 


每 行 的 第 个 字符 表示 文件 类 型 .“- ”代表 普通 文件 ，d" 代 表 目 
录 , 其 他 的 类 型 以 后 还 会 届 到 。 

接 下 来 的 9 个 字符 表示 文件 访问 权限 ,分 为 读 权限 、 写 权限 和 执行 
权限 ,又 分 别针 对 3 种 对 象 : 用 户 、 同 组 用 户 和 其 他 用 户 , 所 以 一 共 
需要 9 位 来 表示 。 从 前 面 的 1s -! 的 输出 中 可 以 看 出 ,所 有 的 文件 
和 日 录 对 所 有 用 户 都 是 可 读 的 ,只 有 文件 的 所 有 者 才能 对 文件 进 
行 修 改 , 所 有 用 户 都 有 taill 的 执行 权限 ， 

链接 数 指 的 是 该 文件 被 引用 的 次 数 , 这 方面 的 内 容 将 在 下 一 章 
介绍 。 

指出 文件 所 有 者 的 用 户 名 。 

指 文 件 所 有 者 所 在 的 组 。 有 些 版 本 的 ls 显示 组 名 。 

第 五 询 显 示 文 件 的 大 小 。 在 前 而 的 ls -1 的 输出 中 ,所 有 的 目录 大 
小 相等 ,都 是 1024 字 节 ,因为 目录 所 占 空间 的 分 配 是 以 块 (block) 
为 单位 的 ,每 个 块 512 字 节 ,所 以 目录 的 大 小 经 常 是 相等 的 。 如 果 
是 一 般 的 文件 ,size 列 则 显示 了 文件 中 数据 的 实际 字 节 数 。 
文件 的 最 后 修改 时 间 。 如 果 是 较 新 的 文件 ,会 列 出 月 .日 和 时 刻 ， 

对 于 较 老 的 文件 ,只 能 列 出 月 .日 和 年 。 

文件 名 


3.6.2 问题 2: ls -1 是 如 何 工作 的 
如 何 得 到 文件 的 信息 呢 ? 在 键盘 上 输入 : 


S man -k file | grep = 


i information 


在 有 些 系统 上 可 以 得 凤 有 用 的 参考 信息 ,有 些 却 不 可 以 。 因 为 这 些 系统 使 用 的 术语 是 


文件 状态 file status) 而 不 


fé X PE (S B Cile information ?或 者 文件 属性 (file properties) KR 


表 文 件 的 各 种 信息 。 提 取 文 件 状态 的 系统 调用 是 stat, 
3,6.3 用 stat 得 到 文件 信息 
图 3.3 显示 了 stat 的 工作 方式 。 
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stal(name, pir) 
将 name 所 指定 的 文件 信 ccs E | 
息 访 入 一 个 结构 中 。 cud 3 | 


[9 3.3 用 siat BEAR XC AY JR HE 


























磁盘 上 的 文件 有 很 多 属性 ,如 文件 大 小 ,文件 所 有 者 的 ID 等 。 如 果 需 要 得 到 文件 属性 ， 
进程 可 以 定义 一 个 结构 struct stat, 然 后 调用 stat ,告诉 内 核 把 文件 属性 存放 到 这 个 结构 中 。 





























Stal 
目标 得 到 文件 的 属性 
头 文件 5 include « sys/stat, h> uu 
ae gm int result = slat(char # fname, struct stat * bufp) 
参数 fname ”文件 名 
bulp 指向 buffer 的 指针 

返回 值 —1 APRA 

0 成 功 返 回 


stat 把 文件 {name 的 信息 复制 到 指针 bufp 所 指 的 结构 中 。 下 面 的 代码 展示 了 如 何 用 
stat 来 得 到 文件 的 大 小 : 


/* filesize.c - prints size of passwd file */ 


# include <stdio.h> 
# include <(sys/stat. h> 


int main(> 

{ 
stroct stat infobuf; /* place to store info «/ 
if ( stat( "/etc/passwd", &infobuf) == -1) /* get info #/ 


perror("/etc/passwd"); 
else 
printf(" The size of /etc/passwd is %d\n", 
infobuf.st size); 
! 


stat 把 文件 的 信息 复制 到 结构 infobul 中 ,程序 从 成 员 变 量 sr_size 中 该 到 文件 大 小 。 
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3.6.4 stat 提供 的 其 他 信息 
stat 的 联机 帮助 和 水文 件 /usr/include/ sys/ stat, h 描述 了 struct stat 的 成 员 变 量 ; 


st_mode 文件 类 型 各 许可 权限 
st_uid 用 户 所 有 者 的 ID 

st gid 所 属 组 的 ID 

st. size 所 占 的 字 节 数 

st nlink 文件 链接 数 

st_mtime 文件 最 后 修改 时 间 
st_atime 交 伴 最 后 访问 时 间 
st_ctime 文件 属性 最 后 改变 时 间 


stat 结构 中 其 他 未 被 ls -1 用 到 的 成 员 变 量 未 在 这 里 列 出 。 下 面 的 例子 fileinfo. c 得 到 
以 上 这 些 属性 ,并 显示 出 来 。 


/* fileinfo.c ~ use stat() to obtain and print file properties 
x - some members are just numbers... 

x/ 

# include < stdio. h> 

# include < sys/types. h> 


H include < sys/ stat. h 


int main(int ac, char x av| j) 


i 
struct stat info; /* buffer for file info «/ 
if (ac7»1) 
if C stat(av[1], &info) |= -1)4 
show stat info( av[1!, &info 5; 
return 0; 
} 
else 
perror(av[) |); /* report stat() errors */ 
return 1; 
i 


Show stat info(char * fname, struct stat * buf) 
/* 
é 


* displays some info from stat in a name = value format 


xf 

{ 
printf(". mode: $on", buf-—-st mode); /* type + mode x/ 
printf(" links: $oXn", buf —-st nlink); ix ft links «/ 
printf(" user ; d\n", buf ——st uid); /* user id «/ 


printf(" group: * din", buf —»st gid); /* group id «/ 
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printf(" size: *dÀn", buf —st size); /* file size x/ 
printf(" modtime: % din", buf —>st_mtime}; /* modified «/ 
printf(" name; % s\n", fname ); /* filename «/ 


4 
í 


编译 并 运行 fileinfo, 并 把 它 跟 Is -上 作对 比 ， 


S ec ~ ofileinfofileinfo.c 
$ ./fileinfo fileinfo.c 
mode; 100664 
links; 1 
user; 500 
group; 120 
size: 1106 
modtime: 965158604 
name: fileinfo.c 
$ ls -lfileinfo.c 


—-rWw—rw-r-- 1 bruce users 1106 Aug 1 15:36 fileinfo.c 


3.6.5 如 何 实现 


链接 数 (links) ,文件 大 小 (size) 的 显示 都 没有 问题 ,最 后 修改 时 间 (modtime) 是 time. t 类 
型 的 ,可 以 用 ctime 将 其 转化 成 字符 串 ,也 没 癌 题 ， 
fileinfo 将 模式 (modqe) 字 段 以 数字 形式 输出 ,然而 需要 的 是 如 下 的 形式 ， 


结构 中 的 用 户 所 有 者 (user) 和 组 (Cgroub) 字 段 都 是 数值 ,而 显示 出 来 的 应 该 是 用 户 和 名 和 
组 名 SAS SEH ls — ,必须 进一步 处 理 模 式 ,用 户 名 和 组 的 显示 。 
3.6.6 将 模式 字段 转换 成 字符 


文件 类 型 和 许可 权限 是 如 何 存储 在 st mode 中 ? 又 如 何 将 它们 转 成 10 个 字符 的 串 ? 从 
进 制 的 100664 又 与 *“-rw-rw-r~-” 有 什么 关系 呢 ? 对 这 3 个 问题 的 回答 就 构成 了 本 节 
的 内 容 。 

st mode 是 一 个 16 位 的 二 进 制 数 ,文件 类 型 和 权限 被 编码 在 这 个 数 中 ,如 图 3.4 所 未 。 


user group olher 





d AX 
z z3 s] 
\'= Dp 5 | 
1 - VA za 








图 3.4 文件 类 型 与 许可 权限 
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其 中 前 4 位 用 作文 件 类 型 ,最 多 可 以 标识 16 种 类 型 ,日 前 已 经 使 用 了 其 中 的 7 个 ， 

接 下 来 的 3 位 是 文件 的 特殊 属性 ,1 代表 具有 某 个 属性 ,0 代表 没有 ,这 3 位 分 别 是 set- 
user - ID fi£ set- group ID 位 和 sticky fiz 3c HM XE TA. 

最 后 的 9 位 是 许可 权限 ,分 为 3 组 ,对 应 3 种 用 户 , 它 们 是 文件 所 有 者 、 同 组 用 户 和 其 他 
用 户 。 其 他 用 户 指 与 用 户 不 在 同一 个 组 的 入 。 每 组 3 位 ,分 别 是 读 、 写 和 执行 的 权限 。 相 应 
的 他方 如 果 是 1 ,就 说 明 该 用 户 拥有 对 应 的 权限 ,0 代表 没有 。 











1. FR mH 
把 多 种 信息 编码 到 一 个 整数 的 不 同 字段 中 是 一 种 常用 的 技术 ,如 : 
编码 的 例子 
617 ~ 495 — 4204 B 电话 时 码 (区 导 -局 导线 导 》 m 
027 -93-1111 社会 保障 号 
128. 103, 33, 100 IP 地 址 


2 如何 读 取 被 编码 的 值 

怎么 来 读 取 被 编码 的 值 呢 ? 比如 怎么 知道 212 ~ 222 - 4444 所 对 应 的 区 号 是 2122. 很 简 
单 ,一 种 方法 是 将 号 码 的 前 3 位 同 212 比较 , 另 一 种 方法 是 将 暂时 不 需要 的 地 方 置 0, 这 里 把 
"Bg ERE 7 位 置 0, 然 后 同 212 - 000 - 0000 比较 。 

为 了 比较 ,把 不 需要 的 地 方 置 0, 这 种 技术 称 为 掩 码 (masking) ,就 如 同 带 上 面具 把 其 他 
部 位 都 遗 起 来 ,就 只 留 下 眼睛 在 外 面 。 这 里 用 一 系列 掩 码 来 把 st mode 的 值 转 北 成 ls -1 要 
旺 孙 的 字符 叮 。 

子 域 编码 (subfield coding) 是 系统 编程 中 一 种 重要 且 常 用 的 技术 ,以 下 从 四 方面 详细 介 
28 TA a SE 

(1) 掩 码 的 概念 

掩 码 会 将 不 需要 的 字段 置 0, 需 要 的 字段 的 值 不 发 生 改 变 。 

C2) 整数 是 bit 组 成 的 序列 

整数 在 计算 机 中 是 以 vic 序列 的 形式 存在 的 ,图 3.5 显示 了 如 何以 二 进 制 的 0 和 1 的 串 
来 表示 十 进 制 的 215。 想 -- 下 00011010 表示 十 进 制 的 儿 ? 

1005s 10s 1's 
128 64 32 


Nt l6 8 4:2 4 
“EEE PEED LT 
8 64 232 146 8 A4 2 | 


图 3.5 在 整数 和 一 进 制 数 之 问 转换 








(3) FETE AR 
与 09 作 位 与 (&) 操 作 可 以 将 相应 的 bit 置 为 0, 图 3. 6 是 八进制 的 100664 通过 位 与 操作 
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把 一 些 bi 置 为 0。 注 意 ,数字 中 的 某 些 1 是 如 何 被 置 为 0 的 。 

















到 3.6 位 与 操作 


(4) 使 用 八进制 数 

直接 处 理 二 进 制 数 是 很 枯燥 乏味 的 。 如 同 处 理 一 长 串 十 进 制 数 时 人们 常 将 它们 三 位 一 
组 分 开 ( 如 23,234,456,022) 一 样 ,一 种 简化 的 方法 是 将 二 进 制 数 每 三 位 分 为 一 组 来 操作 ,这 
就 是 八进制 数 (0 至 7)。 

如 可 以 把 二 进 制 的 1000000110110100 分 为 1,000,000,110,110,100 ,从 而 得 到 八进制 
的 100664 ,这 样 更 容易 理解 ， 

3. 使 用 接 玛 来 解码 得 到 文件 类 型 

文件 类 型 在 模式 字段 的 第 一 个 字 节 的 前 四 位 ,可 以 通过 掩 码 来 将 其 他 的 部 分 置 0. 从 而 
得 到 类 型 的 值 ， 

在 二 sys/stalt.h 之 中 有 以 下 定义 ; 


& define S IFMT 0170000 /* type of File «/ 
#define S IFREG 0100000 /* regular «/ 

# define S IFDIR 0040000 /« directory «/ 

# define 5 IFBLK 0060000 /* block special * 

B define | S IFCHR 0020000 /* character special «/ 
Ë define S IFIFO 0010000 /» fifo*/ 

Z define S IFLNK 0120000 /* symbolic link «/ 

H define S IFSOCK 0140000 /* socket »/ 


S. IFMT 是 一 个 掩 码 , 它 的 值 是 0170000, 可 以 用 来 过 滤 出 前 四 位 表示 的 文件 类 型 。S_ 
IFREG 代表 普通 文件 , 值 是 0100000,S_IFDIR 代表 目录 文件 , 值 是 0040000。 下 而 的 代码 ， 

if ((info.st mode & 0170000) == 0040000 ) 

printf("this is a directory"); 

3B zr RE SU ELEC fib Jc E 0 B p TE 0, 再 与 表示 目录 的 代码 比较 .从 而 判断 这 是 否 是 一 个 
目录 ， 

更 简单 的 方法 是 用 二 sys/stat, h> PAYA KRG ELAR : 

j~ 


x File type macros 


# define S ISFIFO(m) (((m)&(0170000)) == (0010000)) 
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# define S ISDIR(m) (¢(m)&(0170000)) == (0040000)) 


X define S ISCHR(m) — (((m)&(0170000)) == (0020000)) 
# define S ISBLK(m) — ((Crm)&(0170000)) == (008600005) 
# define S ISREG(m) (((m)&(0170000}) == (01000005) 
使 用 宏 的 话 就 可 以 这 样 写 代 码 : 


if (S ISDIRC info. st_made) ) 


printf( "this is a directory"); 


4. 解码 得 到 许可 权限 

模式 字段 的 最 低 9 位 是 许可 权限 , 它 标 识 了 文件 所 有 者 .组 用 户 .其 他 用 户 的 读 、 写 .执行 
权限 。ls 将 这 些 位 转换 为 短 横 和 字母 的 串 。 在 所 sysystat. bh 疙 中 每 一 位 都 有 相应 的 掩 码 , 下 
面 的 代码 给 出 了 如 何 使 用 的 例子 ，; 


fe 
* This function takes a mode value and a char array 
* and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode, 
* NOTE; It does not code setuid, setgid, and sticky 
* codes 
*/ 

void mode to letters( int mode, char str[] ) 

H 


strcpy( str, "------- --- “j; /* default = no perms */ 
if (S ISDIR(mode) ) strLO = 'd'; /* directory? 天” 

if ( § ISCHR(mode} ) str[d, = 'c* /* char devices »/ 

if ¢ 5 ISBLK(mode) ) str[0,; = 'b'; /* block device «/ 

if ( mode & 8 IRUSR ) strį 1] = ‘rt; /* 3 bits for user */ 
if ( mode & S IWUSR ) str[2] = 'w'; 


if ( mode & 5 IXUSR ) str[3] = x! 


if ( mode & 8 IRGRP ) str[4: = 'r'; /* 3 bits for group «/ 
if ( mode & S IWGRP ) str[5' = 'w'; 
if ( mode & S IXCRP ) str[6; = 'x'; 


if ( mode & S_IROTH ) str|7] = 'r'; /* 3 bits for other +/ 
if ( mode & S IWOTH ) str[8] = ‘wo; 
if ( mode & § IXOTH ) str[9] = 'x'; 

} 


9. 解码 并 编写 ls 
到 此 为 止 ;已 经 可 以 正确 处 理 文件 大 小 .链接 数 , 文 件 名 .模式 .最 后 修改 时 间 。 最 后 还 
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有 一 个 要 解决 的 问题 是 文件 所 有 者 Cuser) 和 组 Cgroup) 的 表示 。 
3.6.7 将 用 户 /组 1D 转换 成 字符 串 


在 struct stat 中 ,文件 所 有 者 和 组 是 以 1D 的 形式 存在 的 ,然而 ls 要 求 输出 用 户 名 和 组 
名 ,如 何 根据 ID 找到 用 户 各 和 组 名 呢 ? 

可 以 试 着 在 联机 帮助 中 查找 关键 字 username, uid. group, EE (EA ER. SIE 
统 中 得 到 的 结果 很 不 相同 。 下 面 是 一 些 说 明 

《1) /eic/passwd AG HP 3 

回想 : -下 登录 过 程 , 输 人 用 户 名 和 密码 ,经 过 验证 后 登录 成 功 , 出 现 提 示 符 。 系 统 怎 么 
知道 用 户 各 和 密码 是 正确 的 ? 

这 就 涉及 到 /etc/ passwd 这 个 文件 , 它 包 含 了 系统 中 所 有 的 用 户 信 息 , 下 面 是 一 个 例子 : 


root :WERAdlOWwUxypE:0.0-:root:/Dbin/bash 

bin: * ;1;l;/bin;/bin: 

daemon; » :2;2:;daemon;/sbin; 

snith:xlmEPcp4Tnokc:9768 3073 ; Jame Q Smith: /home/s/smith/ : 
/shells/tcsh 

fred: mSuVNOF4CRTmE - 20359 550 :Fred:/home/f/fred;/shells/tcsh 

diane;70US8flPsrccY.:20555.550.Diane Abramov: /home/d/diane: 
/shells/tcsh 

ajr:WitmEBWylarlw:3607.:3034.Ann Reuter; /home/a/ajr;/shells/bash 


这 是 个 纯 文本 文件 ,每 一 行 代表 -个 用 户 , 用 冒号 ";” 分 成 不 同 的 字段 ,第 一 个 字段 是 用 
户 名 ,第 二 个 字段 是 密码 ,第 三 个 字段 是 用 户 ID, 第 四 个 字段 是 所 属 的 组 , 接 下 来 的 是 用 户 的 
全 名 EHR APER shel 程序 的 路 径 。 所 有 的 用 户 对 这 个 文件 都 有 读 权限 ,关于 这 个 文 
件 的 详细 信息 ,参见 联机 帮助 。 

似乎 使 用 这 个 文件 就 可 以 解决 用 户 ID 和 用 户 和 名 的 关联 向 题 ,只 需 搜 索 用 户 ID, 然 后 就 
可 以 得 到 相应 的 用 户 名 。 然 而 存 实 际 应 用 中 并 不 是 这 样 做 的 ,搜索 文件 是 一 任 很 繁琐 的 工 
作 , 而 且 对 于 很 多 网 络 计 算 系统 ,这 种 方法 是 不 起 作用 的 。 

(2) /etc/passwd 并 没有 包括 所 有 的 用 户 

每 个 Unix 系统 都 有 /etc/passwd 这 个 文件 ,但 它 并 没有 包括 所 存 的 用 户 , 在 有 些 网 络 计 
算 系 统 中 ,用 户 要 能 够 登录 到 系统 中 的 任何 一 台 主 机 上 ,如 果 通 过 /etcypasswd 来 实现 ,就 必 
须 在 所 有 的 主机 上 维护 用 户 信息 ,要 修改 密码 的 话 也 必须 修改 所 有 主 礼 上 的 密码 ,如 果 有 一 
台 主 机 刚好 宕 机 了 ,那么 在 宕 机 期 间 的 用 户 变 化 情况 就 无 法 同步 到 这 台 主 机 上 。 

较 好 的 解决 方法 是 在 一 台大 家 都 能 够 访问 到 的 主机 廿 保存 所有 用 户 信息 , 它 被 称 做 
NIS ,所 有 的 主机 通过 NIS 来 进行 由 户 身份 验证 。 所 有 需要 用 户 信息 的 程序 也 从 NIS LR 
取 。 而 本 地 只 保存 所 有 用 户 的 一 个 子 集 以 备 离线 操作 。 在 联机 帮助 中 有 NIS 的 详细 
信息 。 

(3) 通过 getpwuid 来 得 到 完整 的 用 户 列 表 

BI ULIS Sd FE RA getpwuid 来 访问 用 户 信 息 , 如 果 用 户 信息 保存 在 /etc/passwd 中 ,那么 
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getpwuid 会 查找 /etc/passwd HAS , 刘 果 用 户 信 息 在 NIS 中 ,getpwuid 会 从 NIS 中 获取 信 
息 , 所 以 用 getpwuid 使 程序 有 很 好 的 可 移植 性 。 

getpwuid 需要 UID(user ID) 作 为 参数 ,返回 -个 指向 struct passwd 的 指针 ,这 个 结构 
E X. fE/usr/include/pwd. h 中 : 


/* The passwd structure */ 


struct passwd 1 


char * pw name; /* Username x/ 

char * pu passwd; /* Password «/ 

. vid t pw uid; /* User ID «/ 

. gid t pw dgid; /* Group ID #/ 

char x pw gecos; /* Real name x/ 

char * pw dir; /* Home directory */ 
char * pw shell; /* Shell Program x/ 


P 
这 下 是 1s -1 的 输出 中 需要 的 : 


fa 
* returns a username associated with the specified uid 
* NOTE: does not work if there is no username 
RT 
char + uid to name(uig t uid) 
1 
return getpwnid(uid) —»pw name; 


} 


这 段 代码 很 简单 ,但 还 不 够 健壮 ,如 果 uid 不 是 一 个 合法 的 用 户 ED, AR getpwuid 返回 空 
指针 NULL ,这 时 getpwuid(uid) —> pw. narne 就 没有 意义 ,这 种 情况 会 发 生 吗 ?常用 的 1s 
命令 有 一 种 处 理 这 种 情况 的 办 法 。 

(4) UID 没有 对 应 的 用 户 名 

假设 在 一 台 Unix 主机 上 有 一 个 账号 ,用 户 名 是 pat. HEP ID 是 2000, 创 建 了 一 个 文件 ， 
这 个 文件 的 st uid 的 值 就 是 2000. 

假设 一 段 时 间 以 后 你 搬 走 了 ;系统 管理 员 半 是 把 这 个 账号 删除 ,在 passwd 中 不 再 有 pat 
这 一 行 , 这 时 如 果 getpwuid 得 到 的 参数 是 2000, 它 就 会 返回 NULL. 

标准 的 1s 如 果 导 到 这 种 情况 ,会 打印 出 UID。 

当 新 加 和 人 一 个 用 户 时 ,新 用 户 有 可 能 与 一 个 已 被 删除 的 用 户 有 相同 的 UID, 这 时 , 老 用 
户 所 留 下 来 的 文件 会 被 用 户 所 拥有 ,新 用 户 对 这 些 文件 具有 所 有 的 权限 。 

最 后 一 个 问题 是 组 ID 如 何 处 理 ?” 什么 是 组 ?” 什么 是 组 ID? 

(5) /etc/group 是 组 的 列表 

对 一 台 公 司 里 的 主机 而 言 ,可 能 要 将 用 户 分 为 不 同 的 组 ,如 销售 大 员 一 组 ,行政 人 员 一 
组 等 ， 要 是 在 学 校 里 ,可 能 有 教师 组 和 学 生 组 。Unix 提供 了 进行 组 管理 的 手段 ,文件 
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/etcygroup 是 一 个 保存 所 有 的 组 信息 的 文本 文件 ， 


root::0:root 

other; ;1; 

bin: :2:reot, bin, daemon 
SysS::3:root,bin,sys,adm 
adm::4;root,adm,daemon 
uucp::5:root,uucp 

mail: ;6;root 
tty::7:root,tty,adm 
1p;;B8,root,lp,adm 


第 一 个 字段 是 组 名 ,第 二 个 是 给 密码 ,这 个 字段 极 少 用 到 ,第 三 个 是 组 IDCGIDO ,第 四 个 
是 组 中 的 成 员 列表 ， 

(6) 用 户 可 以 同时 属于 多 个 组 

passwd 文件 中 有 每 个 用 户 所 属 的 组 ,实际 站 那里 列 出 的 是 用 户 的 主 组 (primary group), 
用 户 还 可 以 是 其 他 组 的 成 员 , 要 将 用 户 添 加 到 组 中 ,只 要 把 它 的 用 户 名 添加 到 /etcygroup 中 
这 个 组 所 在 行 的 最 后 一 个 字段 即 可 。 在 刚才 的 例子 中 ,用 户 adm 同时 属于 sys.adm.tty.lp 
等 多 个 组 。 这 个 列表 在 处 理 组 访问 权限 时 会 被 用 到 。 例 如 个 文件 属于 lp 组 , 且 组 成 员 有 
这 个 文件 的 写 权 限 , 所 以 用 户 adm 就 可 以 修改 这 个 文件 。 

(D 通过 getgrgid 来 访问 组 列表 

在 圆 络 计算 系统 中 ,组 信息 也 被 保存 在 NIS rH. Unix 系统 提供 getgrgid BRAM 
现 的 盖 异 。 用 这 个 晃 数 ,用 户 可 以 得 到 组 名 而 不 用 操心 实现 的 细节 。getgrgid 的 用 户 手 册 对 
这 个 函数 及 相关 画 数 做 了 详细 解释 .在 1 -I 中 ,可 以 这 样 得 到 组 名 : 


/* 
* returns a groupname associated with the specified gid 
x NOTE: does not work if there is no groupname 
x 
char * gid to name(gid t gid} 
{ 
return getgrgid( gid) —>qr_name; 


\ 
f 


3.6.8 编写 js2.¢ 


对 ls -1 的 每 一 项 输出 ,都 有 办 法 将 它们 转换 为 用 户 可 理解 的 格式 。 把 它们 综合 起 来 ， 
就 得 到 了 以 下 代码 : 


/* ls2.c 
* purpose list contents of directory or directories 
* action if no args, use . else list files in args 


x note uses stat and pwd. h and grp. h 
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x BUG; try 1s2 /tmp 

x/ 

it include < stdio. h^» 

# include <i sys; types. h= 
# include dirent. h> 


tt include < SYS stat. h> 


void do ls(char[ D ; 

void dostat(char *); 

void show file info( char * , struct stat *); 
void mode to letters( int , char [| >; 

char * uid to name( uid t 5; 


char x gid to name( gid t); 


main(int ac, char * av[]) 


1 
if (ae == 1) 
do ls( "."); 
else 


while ( -~ac }{ 
printf(" € s;in", x ttav); 
do ls( x av 5; 


} 


void do ls( char dirname[] ) 
J% 
* list files in directory called dirname 
af 
i 
DIR * dir ptr; /* the directory */ 


struct dirent « direntp; /* each entry x/ 


it ( (dir ptr = opendir( dirname ) ) == NULL) 
fprintf(stderr, "lsl: cannot open % s\n", dirname); 


else 


{ 
while ¢ ( direntp = readdir( dir ptr ) ) 1 = NULL) 
dostat( direntp —>d_name ); 
closedir(dir ptr); 


} 


void dostat( char « filename ) 


I 
i 


struct stat info; 
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if ( stat(filename, &info)} == - 1} /* cannot stat x/ 
perror( filename ); /* Say why x/ 
else j» else show infa */ 


show file info( filename, &info ); 


void show file info( char x filename, struct stat # info p) 


/ 


i 


" 


j 


* 
* display the info about filename. The info is stored in struct at * info p 


x/ 


char  *uid to name(), * ctime(), * gid to name(), * filemode(); 
void mode to letters(); 


char modestr[ 111; 


mode to letters( info p st mode, modestr ); 


printf( "$s" , modestr ); 


, 


printf( "€ 4d " , (int) info p——st nlink); 


printf( "X -Bs " , uid to name(info p——st uid) ); 
printf( "& — 8s " , gid to namet(info p- >st gid) 5; 
printf¢ "*8ld " | (1ong)info p-7-st size); 

printf( "&.12s ", 4+ ctime(&info p-75st mtime)); 


printf( "$ sin" , filename 2; 


* 


* utility functions 


a*r 


ix 


D 


* This function takes a mode value and a char array 
* and puts into the char array the file type and the 
x nine letters that correspond to the bits in mode. 
* NOTE; It does not code setuid, setgid, and sticky 
* codes 


*/ 


void mode to letters( int mode, char str[ |]? 


1 


strepy( str, "---------- "jr /* default = no perms x/ 
if ( $ ISDIR(mode) ) strfol = 'd'; f» directory? «/ 

if (S ISCHR(mode) ) str[0] = 'e'; /* char devices «/ 

if ( 8 ISBLK(mode) ) str[0] = ‘b's: /* block device x/ 

if ( mode & 8 IRUSR ) str[1j = 'r'; /* 3 bits for user «/ 
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if ( mode & S, INUSR ? str[2] = 'w'; 
if ( mode & S IXUSR ) str(3] = 'x'; 


if ( mode & $ IRGRP ) str[4] = 'r*; /* 3 bits for group */ 
if ( mode & S IWGRP ) str[5] = «wr; 
if ( mode & S IXGRP ) str[6] = 'x'; 





if ( mode & 5 IROTH ) str[7} = 'r'; /* 3 bits for other «/ 
if ( mode & S THOTH 5 str[Bj = 'w'; 
if ( mode & S IXOTE ) str[9] = ‘x! 


# include « pwd. h> 


char * uid to name( uid t uid } 
/* 


* returns pointer to username associated with uid, uses getpw() 


{ 


*/ 


Struct passwd * getpwuid(), * pw ptr; 
static char numstr|10]; 


if ( C pw ptr = getpweid( uid) ) == RULL | 
sprintf(numstr," % d", uid); 
return numstr; 


} 


else 


return pw ptr -—pw name ; 


f include «grp. h> 


char « gid to name( gid t gid ) 


/* 


Jj 


{ 


x returns pointer to group number gid. used getgrgid( 3) 


xf 


struct group * getgrgid(), * grp ptr; 
static char numstr[ 10]; 


if ( ( grp ptr = getgrgid(gid) ) == NULL | 
sprintf(numstr,"%d", gid}; 
return numstr; 


} 


else 


return grp ptr —»-gr name; 
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将 152 的 输出 与 标准 的 1s 对比: 


3 1s2 

drwxrwxr-X “ 4 bruce bruce 1024 Aug 2 18:18 
drwxrwXr-x 5 bruce bruce 1024 Aug 2 18,14 

-rw-rw-r-- 1 bruce users 30720 Aug 1 12;05 s.tar 
-ÉWXYWXFE.—X 1 bruce users 37351 Bug } 12:13 taill 
-rw-rW-r-- 2 bruce users 345 Jul 29 11:05 Makefile 
-Iw-r--r.- 1 bruce users 723 Aug 1 14:26 Isl.c 
-rwW-r--r-- 1 bruce users 3045 Feb 15 03:51 Ils2.c 
-rw-rW-r-- 1 bruce users 27521 sug 1 12:14 chapd3 
drwxrwxr-x 2 bruce users 1024 aug 1 12;14 old src 
drwxrwxr-x 2 bruce users 1024 Aug 1 12.15 docs 
-IWXIWXYE-X 1 bruce bruce 37048 Any 1 14:26 dsl 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15  statl.c 
-IWwXIWXr—x 2 bruce bruce 42295 Aug 2 18:18 is2 
-rw-r--r-- 1 bruce support 191 Feb 9 21:01  statdemo.c 
-rw-r--r-- 1 bruce users 1416 Awg 1 12:05 taill.e 
sis -1 

total 189 

-Yw-rw-r-— 2 bruce users 345 Jul 29 11:05  Makefile 
-rw-rw-r-- 1 bruce users 27521 hug 1 12;14  chap03 
drwxrwxr-x 2 bruce users 1024 Aug i 12:15 docs 
-rWXrWwXr-Xx 2 bruce bruce 42295 Aug 2 18:18 1s2 
-YW-Ir--r-— 1 bruce users 723 Mug 1 14.26 Ilsi.ec 
—EWXIWXE-X 1 bruce bruce 37048 Aug 1 14:26 isl 
-rw-r--r-- 1 bruce users 3045 Feb 15 03:51 ls2.c 
drwxrwxr-x 2 bruce users 1024 Aug. 1 12:14 old src 
-fW-IW-r-— 1 bruce users 30720 Bug i 12;05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18  17;15  statl.c 
-IW-r--r-- 1 bruce support 191 Feb 9 1996  statdemo.c 
—YWKIWAY-X 1 bruce users 37351 Aug 1 12:13 taili 
-rw-r--r-- 1 bruce users 1416 Aug 1 12:05 talil.c 
3 


ls2 的 输出 看 起 来 已 经 很 不 错 了 ,模式 字段 ,用户 名 和 组 各 的 处 理 已 经 完成 。 但 还 有 些 工 
EER. ER ls 会 显示 记录 总 数 ,1s2 不 会 ,而且 152 述 没 将 结果 按 文件 名 排序 ,也 不 支持 
选项 -a。 它 还 假设 参数 是 目录 名 。 

1s2 还 有 一 个 致命 的 问题 ,不 能 显示 指定 目录 的 信息 ,你 可 以 试 一 试 , 在 命令 行 输入 : 
ls2 /tmp。 可 以 在 本 章 结 尾 的 练习 中 修正 这 些 问题 。 
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3.7 三 个 特殊 的 位 


结构 stat 中 的 st mode ALAS 16 位 ,其 中 4 位 用 作文 件 类 型 ,9 位 用 作 许可 权限 , 剩 
下 的 3 位 用 作文 件 特殊 属性 。 


3.7.1 set-user-ID ft 


在 这 3 位 中 ,第 一 位 叫做 set~ user- TD 位 , 它 的 出 现 是 为 了 解决 一 个 重要 的 问题 * 即 用 
户 如 和 何 更 改 自 己 的 密码 ? 

看 起 来 好 像 很 容易 ,用 passwd 命令 就 可 以 ， 

接 下 来 研究 一 下 passwd 的 工作 原理 , 先 来 看 /etc/passwd 这 个 文件 ,注意 这 个 文件 的 所 
有 者 利文 件 访问 权限 设置 : 


5 ls — 1 /etc/passwd 
-r4-r--r-— 1 root root  B94 Jun 20 19.17  /etc/passwd 


更 改 密码 会 导致 上 述 文 件 内 容 的 变化 ,但 是 普通 用 户 没 有 修改 这 个 文件 的 权限 ,只 有 
root 用 户 才 打 以 修改 它 ,passwd 命令 怎么 能 欧 修 改 这 个 义 件 呢 ? 

解决 的 办 法 ,不 是 给 所 有 用 户 修 改 这 个 文件 的 权限 ,而 是 给 passwd 命令 一 个 特殊 的 权限 ， 
使 passwd 命令 的 文件 所 有 者 是 root, 而 且 它 的 特殊 属性 中 包含 set user -ID fg HD P: 





$ ls — 1 /usr/bin/ passwd 
-r-sr-xr-x 1 root bin 15725 Oct 31 1997  /usr/bin/passwd 


SUID 位 告诉 内 核 , 运 行 这 个 程序 的 时 候 认 为 县 由 文件 所 有 者 在 运行 这 个 程序 ,在 这 里 
就 是 root, Ii] root 有 修改 /etci passwd 的 权限 ， 

L 是 否 可 以 更 改 其 他 用 户 的 密码 ? 

答案 是 否定 的 ,passwd 命令 知道 是 谁 在 运行 程序 。 它 用 系统 调用 getuid 来 得 到 用 户 ID, 
passwd 命令 是 可 以 修改 /etc/ passwd 这 个 文件 ,但 它 只 会 修改 该 用 户 ID 所 对 应 的 密码 。 

2. set- user - ID $5 3 48 J sb 

SUID 位 经 常用 末 给 其 些 程序 提供 额外 的 权限 ,比如 系统 中 的 打印 队列 。 有 可 能 同时 有 
很 多 用 户 发 出 打印 请 求 , 但 系统 只 有 一 台 打 印 机 ,这 时 要 把 打印 请 求 都 放 到 打印 队列 中 去 ， 
命令 lpr 负责 把 儿 户 要 打印 的 文件 复制 到 一 个 特定 的 系统 目 水 中 去 。 如 果 这 个 自 录 所 有 用 
户 都 有 访 何 权限 , 那 将 会 产生 一 些 不 安全 因素 ,恶意 用 户 有 删除 别人 的 打印 作业 的 可 能 。 设 
E lpr 的 SUID 位 就 可 以 解决 这 个 问题 ,使 lpr 的 文件 所 有 者 是 root 和 lpr。 当 一 个 普通 用 户 
调用 Ipr 时 ,lpr 就 以 root 或 lpr 的 权限 运行 ,可 以 对 这 个 系统 目录 进行 操作 ,而 普通 用 户 却 
不 能 直接 对 这 个 日 录 进 行 控制 执行 从 打印 队列 称 除 操作 的 程序 也 是 设置 SUID 的 。 

一 些 游 戏 会 把 成 绩 最 好 的 用 户 的 信息 写 入 数据 库 或 记录 文件 ,可 以 把 这 些 执行 写 动作 
的 程序 的 文件 所 有 者 设 为 数据 库 或 记录 文件 的 所 有 者 ,再 设 上 set-user-ID 位 ,这 样 普通 用 
户 帮 可 以 玩 游 戏 ,位 只 有 游戏 程序 才 可 以 修改 成 绩 ， 
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3. 检验 SUID tha 
Ay PLE iE sys/stat. hz» E Y. ER ib spe d TRAE EA SUID fy: 


Hdefine 5$ ISUID 0004000 /* set user ID on execution */ 





将 它 转 换 为 二 进 制 ,将 会 看 到 它 正好 是 3 TEAR BH. 
3.7.2 set-group-ID fz 


第 二 个 特殊 属性 位 是 用 来 设置 程序 运行 时 所 属 组 的 ,如 果 一 个 程序 所 属 的 组 设 为 g, 而 
HÈR set- group- ID 位 也 被 设置 ,那么 程序 运行 的 时 候 就 好 像 它 正 被 E 组 中 的 某 一 个 用 户 
运行 一 样 。set-groub-ID 位 给 程序 某 一 个 组 的 访问 权限 。 

可 以 通过 < 一 sysy stat. h> 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 set- group- ID fi: 


H#define S ISGID 0002000 /*set group ID on execution,’ 


3.7.3 sticky 位 


sticky 位 对 于 文件 和 月 孙 有 不 同 的 用 途 。 对 于 文件 而 言 , 早 期 的 Unix 系统 经 常 要 在 有 
限 的 内 存 中 同时 运行 很 多 程序 , 它 使 用 到 交换 (swap) 技 术 。 例 如 系统 中 内 存 只 有 1MB 的 剩 
余 空 间 , 但 系统 要 同时 运行 3 个 程序 ,每 个 需要 0. OMB 的 内 存 ,很 明显 ,剩余 空间 只 人 允许 两 个 
程序 待 在 内 存 中 。 在 某 个 时 候 如 虹 某 个 程序 没 运 行 , 内 核 会 把 它 临 时 地 存放 到 硬盘 上 一 个 
叫 变 换 空间 的 分 区 中 , 空 出 来 的 内 存 可 以 给 其 他 程序 使 用 , 当 在 交换 空间 中 的 程序 将 要 再 次 
运行 时 ,内 核 会 把 它 装 载 到 内 存 中 。 

从 交 搞 空间 装载 程序 要 比 从 普通 的 硬盘 空间 快 ,在 非 交 换 空间 的 硬盘 上 ,程序 可 能 被 分 
成 好 几 块 分 别 存放 在 多 个 地 方 , 交 换 空 间 上 的 文件 是 不 分 块 的 。 

一 些 经 常用 到 的 程序 ,如 编辑 器 编译 高 和 游戏 ,她 果 位 于 交 摸 空间 上 ,那么 装载 的 速度 
就 会 快 得 多 。sticky 位 告诉 内 核 即 使 没有 人 在 使 用 程序 ,也 要 把 它 放 在 交换 空间 中 。 程 序 粘 
在 交换 空间 中 ,就 好 像 口 香 糖 粘 在 鞋子 上 一 样 。 

现在 ,交换 技术 已 经 不 像 以 前 那么 重要 了 ,取而代之 的 是 虚拟 内 存 技术 ,虚拟 内 存 使 得 
可 以 以 更 小 的 单位 ,如 页 (page) ,进行 交换 。 

对 于 目录 | 前 言 sticky 的 含义 是 不 同 的 。 有 些 目录 被 设计 用 来 存放 临时 文件 ,如 /tmp，, 谁 
都 可 以 往 这 里 创建 /删除 文件 ,sticky 位 使 得 目录 里 的 文件 只 能 被 创建 者 删除 。 


3.7.4 用 1s-1 看 到 的 特殊 属性 


正如 刚才 所 看 到 的 ,每 个 文件 有 12 位 的 文件 属性 ,但 ls 只 用 9 个 字符 来 表示 , 它 是 如 何 
来 表示 的 呢 ? 
来 看 下 面 的 例子 ， 


-rusr-sr-t 1 root root 2345 Jun 12 14:02 sample 
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在 许可 权限 部 分 ,用 户 的 x Be s ACE set user - ID MERE AAPA x RRs, 
代表 set-group-ID 被 设置 ,其 他 用 户 的 x 被 替换 成 t, 代 表 sticky 被 设置 ,更 详细 的 信息 参 
见 联机 帮助 


3.8 Is 小 结 


本 章 编写 的 ls 程序 可 以 列 出 目录 里 的 文件 ,还 可 以 列 出 文件 的 详细 信息 。 在 分 析 和 实 
现 的 过 程 中 ,应 该 可 以 学 到 Unix 很 多 方面 的 知识 。 

(1) 文件 与 目录 

Unix 将 数据 存放 于 文件 中 ,日 录 是 特殊 的 文件 , 它 的 内 容 就 是 其 中 的 文件 和 子 目 录 的 名 
字 , 还 包 合 自己 的 名 字 ,Unix 提供 一 系列 函数 对 且 录 操作 ,打开 . 读 , 定 位 ,关闭 等 ,但 不 提供 
写 目 录 的 函数 ，。 

(2) 用 户 与 组 

系统 中 的 每 个 用 户 都 有 用 户 和 名 和 用 户 ID 人们 可 以 用 用 户 名 登录 到 系统 。 系 统 通过 
UID 来 区 分 不 间 用 户 的 文件 。 每 个 用 户 都 属于 至 少 一 个 组 。 每 个 组 都 有 组 名 和 组 ED. 

(3) 文件 属性 

每 个 文件 都 有 很 多 属性 ,程序 通过 系统 调用 stat 来 得 到 文件 的 属性 。 

(4) 文件 的 所 有 关系 

每 个 文件 都 有 文件 所 有 者 ,文件 所 有 者 的 ID 是 文件 属性 的 一 部 分 。 同样 的 每 个 文件 都 
属于 某 个 组 ,组 ID 也 是 文件 属性 的 一 部 分 。 

(5) 许可 权限 

文件 的 许可 权限 规定 了 哪 种 用 户 可 以 进行 跟 些 操作 ,有 3 种 用 户 , 文件 所 有 者 \、 辣 组 用 
户 和 其 他 用 户 ,3 种 操作 : EUER. 


3.9 设置 和 修改 文件 的 属性 


文件 有 很 多 属性 ,js -1 可 以 列 出 来 ,这 些 属性 是 如 何 建立 的 ? 是 否 可 以 改变 文件 的 属 
TE? 如 果 可 以 ,如 何 改 ?如果 不 可 以 ,为 什么 ? REE PREAMP, 


-rW-r--r-- 1 bruce users 3045 Feb 15 03:51  1s2.c 
从 左 到 右 来 看 文件 152. c 的 属性 ， 
3.9,1 文件 类 型 


文件 的 类 型 有 普通 文件. 目录 文件 .设备 文件 ,socket 文件 .符号 链接 文件 、 命 名 管道 
(named pipe) 文 忻 等 。 

(1) 文件 类 型 的 建立 

文件 羔 型 是 在 创建 文件 的 时 候 建 立 的 ,如 用 系统 调用 creat 建立 一 个 普通 文件 。 其 他 类 
型 的 文件 如 目录 、 设 备 等 ,可 使 用 不 回 的 函数 创建 。 
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(2) 修改 文件 类 型 
文件 一 经 创建 ,类 型 就 无 法 修改 ,虽然 在 童话 里 ,南瓜 可 以 变 成 马车 ,但 这 里 的 文件 类 型 


是 不 能 变 的 。 
3.9.2 许可 位 与 特殊 属性 位 


每 个 文件 都 有 8 位 的 许可 权限 和 3 位 的 特殊 属性 ,它们 是 在 文件 创建 的 时 候 建 立 的 , 创 
建 以 后 ,它们 可 以 被 chmod 系统 调用 修改 。 

(D 建立 文件 的 模式 

creat 的 第 二 个 参数 指定 了 要 创建 文件 的 许可 位 ,如 : 


fd = creat( "newfile", 0744 ) 


指定 新 创建 文件 的 许可 位 为 rwxr-r--。 

这 个 参数 只 是 请 求 , 而 不 是 命令 。 内 核 会 通过 “新 建文 件 撞 码 ”(file- creation mask) 
来 得 到 文件 的 最 终 模式 。“ 新 建文 件 羯 码 " 是 一 个 很 有 用 的 系统 变量 , 它 指定 哪些 位 需要 
被 关 掉 。 例 如 要 防止 程序 创建 能 被 同 级 用 户 和 其 他 用 户 修 改 的 文件 ,那么 可 以 通过 关 掉 
---~-w--~w- 来 实现 。 这 可 以 通过 把 “新 建文 件 掩 码 ”的 值 设 为 八进制 数 022 来 实现 。 
例如 : 


umask( 022 }; 


这 里 的 umask 是 一 个 系统 命令 ,可 以 改变 变量 umask 的 的 值 。 
(2) 改变 文件 的 模式 
程序 可 以 通过 系统 调用 chmod 来 改变 文件 的 模式 ,如 : 


chmod( "/tmp/myfile", 04764) ; 
chmod( "/tmp/myfile",S ISUID|S IRWXU| S_IRGRP}S IWGRP|S IROTH 5; 


上 述 两 条 指令 的 作用 相同 ,第 一 条 是 八进制 来 表示 ,第 一 条 是 用 一 sysystat. h> Pe XC 
的 符号 来 表示 。 后 者 有 明显 的 优点 , 当 系 统 定义 的 许可 位 的 值 改变 时 ,无 项 修 改 程序 . 系统 
调用 chmod 不 受 “ 新 建文 件 掩 码 ” 的 影响 。 























chmod 

目标 修改 文件 的 许可 权限 和 特殊 属性 
头 文 件 # include < sys/ types, h> 

# include < sys/stat, h> 
CEE int result = chmod char * path, mode, t mode}; 
参数 path 文件 各 

mode 新 的 许可 权限 种 特殊 饮 性 
返回 慎 一 1 38 e HER 


0 成 项 返回 
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(3) 用 来 修改 文件 的 许可 权限 和 特殊 届 性 的 命令 
Shell 命令 chmod 也 可 以 用 来 完成 上 人 述 操作 。 它 可 以 通过 两 种 模式 指定 权限 和 属性 , 八 
进 制 模式 (如 04764) 和 符号 模式 (如 u 一 rws g—rw or), 


3.9.3 文件 的 链接 数 


关于 链接 数 的 详细 讨论 在 下 一 章 。 简 而 言 之 ,链接 数 就 是 文件 被 引用 的 次 数 5( 别 名 的 数 
RO. ME -个 文件 在 月 未 树 中 一 共有 3 个 别名 ,那么 这 个 文件 的 链接 数 就 是 3。 增加 文件 
的 别名 (使 用 link) 会 使 链接 数 增加 ,减少 别名 (使 用 unling) 会 使 链接 数 减 少 。 


3.9.4 文件 所 有 者 与 组 


每 个 文件 都 有 文件 所 有 省 ,Unix 通过 用 户 ID 和 组 ID 来 标识 文件 所 有 者 和 文件 所 属 
的 组 。 

OD 文件 所 有 者 

简单 的 说 ,文件 所 有 者 就 是 创建 文件 的 用 户 , 用 户 通 过 creat 建立 文件 时 ,内 核 把 文件 所 
有 者 设 为 运行 程序 的 用 户 ,如 果 程 序 具 有 set-user-ID 位 :那么 新 文件 的 文件 所 有 者 就 是 程 
序 的 文件 所 有 者 。 

(2) 组 

通常 情况 下 ,新 文件 的 组 被 设 为 执行 创建 动作 的 用 户 所 在 的 组 ,在 有 些 情 况 下 ,组 会 被 
BASRA RAMA, ROT REY REINA DERE TREAS B3. CBE E RR. 

(3) 修改 文件 所 有 者 和 组 

通过 系统 调用 chown 来 修改 文件 所 有 者 和 组 : 











chown( "filel", 200, 40); 


将 文件 filel 的 用 户 ID 改 为 200, 组 TD 改 为 40, 如 果 后 两 个 参数 的 值 都 是 --1, 那 么 文件 
所 有 者 和 组 都 不 会 改变 。 一 般 用 户 不 大 会 修改 文件 的 文件 所 有 者 和 组 ,但 root 经 常 出 于 管 
理 上 的 目的 要 修改 这 些 内 容 。 文 件 所 有 者 可 以 把 文件 的 组 改 成 任何 一 个 他 所 属 的 组 . 

















chown 
目标 fk gg SC PE BT ES EUER 
头 文件 # include <Cunistd. h> 
OF dE i int chown(char * path, nid t owner, gid_t group? 








参数 Path 文件 名 
owner ”新 的 文 特 所 右 者 ID 
group ”新 的 组 ID 

18 Bl fi 一 1 遇 到 错误 
0 KIEM 


(4) 用 米 修 改 文 件 折 有 者 和 组 的 命令 
Shell 命令 chown 和 chgrp 可 以 用 来 修改 文件 所 有 者 和 组 ,它们 可 以 一 次 修改 多 个 普 件 ， 











第 3 章 目录 与 文件 属性 : 编写 ls 。 9] * 





可 以 用 用 户 名 /组 名 作为 参数 ,也 可 以 用 用 户 ID 组 ID 作为 参数 ,关于 它们 的 详细 使 用 说 明 
参见 联机 帮助 。 
3.9.5 文件 大 小 

文件 . 旦 录 和 命名 管道 的 大 小 是 它们 实际 所 占用 的 存储 空间 的 字 GXE HL SAAR 
加 肉 容 时 ,文件 的 大 小 会 自动 增加 ,可 以 使 用 系统 调用 creat FEUER AD EW 0。 不 存在 能 
够 直接 减 小 文件 占用 的 空间 的 函数 。 


3.9.6 时间 


每 个 文件 都 有 3 个 时 间 : 最 后 修改 (modification7 时间, 最 后 访问 (access) 时 间 和 属性 
《如 用 户 所 有 者 LD .许可 权限 ?最 后 修改 时 间 , 当 文件 被 操作 时 ,内 核 会 日 动 地 修改 这 些 时 间 ， 
也 可 以 编程 来 履 改 最 后 修改 时 间 种 最 后 访问 时 间 ， 

OD 修改 最 后 修改 时 间 和 最 后 访问 时 间 

utime 系统 调用 可 以 用 来 设置 最 后 修改 时 间 和 最 后 访问 时 间 ,使 用 - -个 包 会 两 个 time t 
结构 的 变量 ,一 个 ume t 用 来 存放 更 新 的 最 后 修改 时 间 , 另 一 个 是 最 后 访问 时 间 。 














utime 

目标 修改 文件 最 后 修改 时 间 和 最 后 访问 时 间 oe 

# include <Usys/time, h> 
头 文件 # include <lutime. h > 

# include < sys/types. h> 
e d m a int utime(char * path, struct utimbuf. * newtimes) 

path 文件 名 
参数 newtimes 指向 结构 变量 utimbul 的 指针 

EE GL utime, h 

=i FECT = 
EUN 0 战功 返回 


什么 时 候 希 取 修 改 这 些 时 间 呢 9 举 个 例子 ,在 文人 性 备份 的 时 候 , 文 人 性 的 最 后 修改 时间 种 
访问 时 间 会 被 记录 下 来 , 当 立 件 被 恢复 的 时 候 , 希 望 文 件 的 这 些 时 间 与 原来 的 相同 ,这 时 候 
就 可 以 用 utinte。 恢 复 时 做 了 两 件 事 ,- 一 是 把 备份 的 文件 复制 回去 ,二 是 抠 最 后 人妖 改 时 间 和 
访问 时 间 改 成 备份 时 候 的 情况 ,这 样 被 恢复 的 文件 就 与 备份 时 的 完全 一 样 。 

(20 用 命令 修改 最 后 修改 时 间 和 最 后 访问 时 间 

shell 命令 touch 可 以 修改 文件 的 最 后 访问 时 间 和 最 后 修改 时 间 , 详 细 的 信息 参见 联机 
帮助 。 


3.9.7 文件 名 


创建 文件 时 会 指定 一 个 文件 名 ,命令 mv 可 以 改变 一 个 文件 的 名 字 , 也 可 以 把 文件 从 -一 
个 地 方 称 动 到 另 一 个 地 方 。 

OD 文件 名 的 建立 

系统 调用 creat 在 指定 文件 模式 的 同时 会 指定 文件 的 名 字 。 


>» 02 >» 
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(2) 修改 文件 名 
系统 调用 rename 可 以 修改 文件 /目录 的 名 字 , 还 可 以 移动 文件 的 位 置 , 它 有 两 个 参数 ， 
漂 文 件 名 各 新 文件 名 。 
rename 
目标 修改 文件 名 或 移动 文件 的 位 置 E 
头 文件 # include -< stdio. h> - 
函数 原型 HT int result = rename( char * old, char * new ) 
参数 old 原来 的 文件 名 或 目录 名 
new 新 的 文件 名 或 目录 名 
返回 值 =] 过 到 错误 
0 成 功 返 回 
小 bt 
1 主要 内 容 


* 


2. 


磁盘 上 有 文件 和 目录 ,文件 和 目录 都 有 内 容 和 属性 。 文 件 的 内 容 可 以 是 任意 的 数据 ， 
日 录 的 内 容 只 能 是 文件 名 / 子 有 目录 名 的 列表 ，。 

目录 中 的 文件 名 / 子 目 录 和 名 指向 文件 和 其 他 的 目录 ,内 核 提 供 了 系统 调用 来 读 取 目 录 
的 内 容 、 读 取 和 修改 文件 的 属性 ， 

文件 类 型 .文件 的 访问 权限 和 特殊 属性 被 编码 存储 在 一 个 16 RO rb RT PB sc E 
码 技 术 来 读 取 这 些 信 息 

文件 所 有 者 和 组 信 息 是 以 ID 的 形式 保存 的 ,它们 与 用 户 名 和 组 名 的 联系 保存 在 
passwd 和 group 数据 库 中 ， 

进一步 的 问题 


从 本 章 可 以 知道 目录 的 内 容 是 文件 名 和 和 目录 名 的 列 宕 ;目录 被 互相 连接 组 成 一 棵 树 , 它 
们 是 如 何 连 在 一 起 的 ? 下 一 章 会 对 目录 的 结构 做 详细 的 介绍 。 


3. 


图 示 


BER. BR .文件 及 它们 的 属性 如 图 3.7 所 示 。 


4, 


习题 


3.1 Æ struct dirent 中 ,数组 d_name[ ] 的 长 度 在 有 的 系统 上 是 1; 而 在 有 的 系统 上 是 


255, 实 际 的 长 度 是 多 少 ? 为 什么 会 有 这 些 不 同 ? 为 什么 不 定义 成 char * ? 


3.2 ”文件 保护 模式 ------ rwx 可 以 通过 命令 chmod 007 filename 得 到 ,虽然 这 种 做 潜 


很 奇怪 ,但 却 是 合法 的 ,其 他 用 户 对 文件 有 全 部 权限 ,组 用 户 和 文件 所 有 者 都 没有 
给 任何 权限 。 对 于 这 样 的 文件 , 堆 可 以 该 ? 当 内 核 执行 open 时 ,采用 的 是 什么 好 
辑 来 判断 是否 可 以 执行 ? 通过 实验 来 验证 自己 的 想法 ,如 果 可 以 看 到 内 核 的 代 
码 ,阅读 相关 代码 。 
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stat ( ) 





RAL? 磁盘 上 有 目录 ,文件 及 它们 的 属性 


3.3 ”每 个 用 户 都 有 用 户 名 .每 个 用 户 名 都 有 对 应 的 用 户 D 是否 可 能 两 个 不 同 的 用 户 
名 对 应 一 个 相同 的 ID? 是 否 允 许 同 一 个 用 户 拥有 两 个 不 同 的 ID? 如 果 有 root 权 
限 , 可 以 试 一 试 ,创建 两 个 用 户 , 改 成 同一 个 ID ,但 有 不 同 的 用 户 名 和 密码 。 这 两 
个 用 户 是 否 可 以 修改 对 方 的 文件 ? who 输出 什么 ? 1s -1 输出 什么 ?命令 id 笨 出 
什么 ”相互 发 送 email 呢 ? 从 中 能 够 看 出 些 什 么 ? 多 个 用 户 使 用 同一 个 ID 还 有 
什么 其 他 用 途 ? 


3.4 与 普通 的 文件 一 样 , 目 录 也 有 特殊 属性 位 ,其 中 包含 set~user-JD 和 set 一 group~ 
ID 位 ,使 set-user- TD 有 效 对 目录 有 什么 影响 ? 如 果 有 .那么 是 什么 ? 为 什么 ? 
如 果 没 有 影响 ,那么 你 能 想象 出 这 些 位 有 什么 作用 妈 ? 


3.5 每 个 文件 的 执行 权限 都 可 以 被 打开 或 关闭 ,假设 一 个 纯 文 本 文件 上 共有 执行 权限 ， 

| ERS TORN? 如 果 一 个 包含 可 执行 代码 的 文件 ,如 对 CC 诺言 编译 后 的 可 执 

行文 件 a. out, 没 有 执行 权限 的 话 , 它 是 否 可 以 被 执行 ?讨论 执行 权限 和 可 执行 代 
HAREKI. 它们 之 同 有 关系 吗 ? 参见 命令 file 的 联机 帮助 。 


3.6 每 个 用 户 都 有 用 户 名 和 用 户 ID, 这 可 以 被 认为 是 两 种 标识 系统 ,为 什么 要 这 样 ? 
能 不 能 直接 用 用 户 名 来 表示 文件 所 有 者 ? 为 什么 ”能 不 能 只 用 其 中 一 种 标 可 系 
统 ? 两 套 表 示 系 统 有 什么 优 缺 点 ”如 果 由 你 来 汕 计 系统 ,你 会 如 何 设计 ? 


3.7 命令 dirent 的 联机 帮助 中 得到 了 系统 调用 getdents(2), 它 的 功能 是 什么 ? 与 
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3. 10 


readdir 有 什么 关系 ? 


命令 1s--1 的 输出 中 有 这 样 一 项 drwxr-xr-x; 表 示 这 是 一 个 目录 , 它 的 文件 所 有 者 
有 全 部 权限 ,组 用 户 和 其 他 用 户 只 有 读 和 执行 的 权限 。 对 于 文件 而 肖 , 执 行 权 限 
意味 着 计算 机 可 以 执行 其 中 包含 的 机 器 代码 或 脚本 语句 ,对 于 目录 而 言 ,执行 权 
限 有 什么 意义 ? 可 以 用 chmod 来 美 掉 这 个 自 录 的 执行 权限 ,看 看 会 发 生 什 么 。 


用 户 是 通过 终端 或 终端 模拟 程序 登录 到 系统 中 的 ,终端 设备 文件 位 于 /dev 目录 
下 ,输入 1s -1 /dev/tty * | more, 显 示 出 所 有 的 终端 设备 文件 的 详细 信息 ,与 普通 
文件 一 样 :终端 设备 文件 也 有 文件 所 有 者 ,就 是 在 这 个 终端 登录 的 用 户 , 无 用 户 使 
用 的 终端 设备 的 文件 所 有 者 是 root, 

终端 设备 文件 的 文件 所 有 者 被 login 程序 所 改变 ,查看 login 的 源 代 码 , 找 到 改变 
文件 所 有 者 的 部 分 。 当 用 户 注销 时 ,终端 设备 的 文件 所 有 者 会 被 改 同 成 root, Æ 
哪 … 个 程序 改变 文件 所 有 者 的 ? 





. 编程 练习 


为 了 将 分 栏 输 出 的 功能 加 入 到 181. c 中 ,观察 标准 的 Is 的 输出 ,发 现 每 一 栏 的 宽 
度 是 由 这 一 栏 最 长 的 文件 名 决定 的 ,而 且 显 东 的 栏 数 还 受 终端 显示 器 的 冤 度 影 
响 ,每 一 列 尽 可 能 的 等 宽 。 这 是 如 何 实现 的 ? 


前 面 提 到 152. c 无 法 处 理 在 命令 行 给 出 月 录 作 为 参数 (1s2 /tmp) ,修改 182. c 使 之 
能 够 处 理 。 


修改 182. c, 使 之 能 够 正确 显示 文件 特殊 属性 suid, sgid 和 sticky, 参 见 联 机 帮助 
确保 程序 能 处 理 各 种 情况 。 


使 用 标准 的 cp 时 ,如 果 第 二 个 参数 是 目录 ,那么 会 把 第 一 个 参数 指定 的 文件 复制 
到 相应 的 日 录 下 ,如 : 

$ cp filel /tmp 
等 价 于 : 

$ cpfilel /tmp/filel 


修改 第 2 章 的 cpl.c 使 之 能 够 完成 上 述 工 作 。 


有 时 需要 对 整个 目录 作 备 份 ,修改 cpl. c 使 得 当 两 个 参数 都 是 目录 时 ,把 第 一 个 
目录 中 的 所 有 文件 复制 到 第 二 个 目录 中 ,文件 名 不 变 。 


修改 151. c 使 得 它 能 够 将 文件 排序 后 输出 。 标准 的 ls 支持 选项 -r, 它 的 作用 是 
逆序 输出 ,把 这 项 功能 也 加 入 到 lsl. c 中 。 有 些 版 本 的 ls 支持 选项 -q; 它 的 作用 
是 不 排序 箱 出 , 当 目录 中 的 文件 特别 多 的 时 候 , 可 以 加 快 1s 的 输出 速度 。 


有 一 个 目录 , 它 的 许可 权限 为 rwxr — x- xy 写 出 对 应 的 st. mode 的 二 进 制 
形式 。 





第 3 章 目录 与 文件 属性 : 编写 ls * 95 ， 





当 关 掉 一 个 文件 的 读 权限 ,就 不 能 打开 这 个 文件 来 读 。 如 果 从 一 个 终端 登录 , 打 
开 一 个 文件 ,保持 文件 的 打开 状态 ,然后 从 另外 的 终端 登录 ,去 掉 文 件 的 读 权 限 ， 
这 时 有 什么 事情 会 发 生 ? 编写 一 个 程序 , 先 用 open() 打 开 一 个 文件 ,用 readO iX 
一 些 内 容 , 调 用 sleep(20) 45 FF 20 s 以 后 ,再 读 一 些 内 容 , 从 另外 的 终端 ,在 等 待 的 
20 s 内 去 掉 文 件 的 读 权 限 , 这 样 会 有 什么 结果 ? 


标准 的 ls 支持 选项 -及 , 它 的 功能 是 递归 地 列 出 县 录 中 所 有 的 文件 包 信子 目录 中 
的 文件 。 修 改 ls2.c, 使 之 支持 这 一 功能 。 


标准 的 ls 支持 选项 ~-u, 它 会 显示 出 文件 的 最 后 访问 时 间 , 如 果 用 了 一 u 而 不 用 一 
1, 会 有 什么 结果 ? 修改 1s2. c 使 之 支持 这 一 功能 。 提 示 : 读 -1 选项 的 内 容 。 


自己 编写 一 个 chown, 使 之 能 够 接收 用 户 名 或 用 户 ID 作为 参数 ,能 够 一 次 修改 多 
个 文件 的 文 作 所 有 者 。 考 虑 以 下 问题 ,如 何 将 文件 各 转换 为 用 户 ID? 如 果 用 户 
名 不 存在 怎么 办 ? 提示 ; 要 测试 这 个 程序 ,可 能 需要 管理 员 的 权限 。 


在 做 文件 恢复 的 时 候 , 不 仅 希 望 将 文件 恢复 ,还 希望 将 文件 的 最 后 修改 时 间 和 最 
后 访问 时 间 恢 复 ,编写 cp 来 实现 上 述 要求 。 


可 以 通过 终端 设备 文件 来 与 用 户 收发 数据 ,如 程序 从 这 个 文件 读数 据 ,就 等 于 从 
用 户 的 键盘 读数 据 , 写 数据 就 等 十 将 数据 显示 在 屏幕 上 。struct stat 中 的 成 员 变 
量 st_mtime 记录 了 文件 最 后 修改 时 间 , 编 号 程序 lastdata Fi 1B £g 4 FH A B3 rp Br 
设备 文件 的 最 后 修改 时 间 ,输出 格式 参照 who, 





6. 项 目 
根据 本 章 所 学 的 内 容 , 可 以 编写 以 下 的 Unix 程序 : 


ehmod file, chown chgrp. finger .Louch 
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概念 与 技巧 

。 Unix 树 状 文件 系统 的 概念 

* Unix 文件 系统 的 内 部 结构 ; i- 节 点 和 数据 块 
* 目录 的 连接 方式 

*。 PARAS REN ELO AA KSA 
* pwd 的 工作 原理 

。 文件 系统 的 装载 (mounting) 

相关 系统 调用 

* mkdir,rmdir,chdir 

* link,unlink,rename,symltnk 

相关 命令 

* pwd 


4.1 介 2H 


文件 包含 数据 ,而 月 录 是 文件 的 列表 。 不 同 的 目录 互相 连接 构成 树 状 的 结构 。 目 录 还 
可 以 包含 其 他 的 日 如 。 文件“ 在 一 个 目录 中 ”是 什么 意思 呢 ?” 当 登录 到 一 全 Unix 的 机 器 上 ， 
可 以 说 你 处 在 “你 的 主 日 录 中 ” ,一 个 人 “处 在 某 个 目录 中 ”又 是 什么 意思 更? 

树 状 结构 像 是 一 个 神话 。 一 个 硬盘 实际 上 是 由 一 些 金属 圆 盘 构成 的 ,每 个 盘面 上 都 有 
磁性 物质 ， 这 些 金属 盘 如 何 显示 为 一 个 包含 文件 .属性 和 目录 的 树 状 结构 呢 ? 

为 回答 这 些 问 题 需要 编号 自己 的 pwd 命令 。pwd 显示 你 在 日 录 树 中 的 当前 位 置 。 从 树 
根 到 你 所 处 位 置 所 经 过 的 目 尖 的 序列 被 称 做 路 径 (Path) 。 要 编写 pwd, 必 须 了 解 文件 和 目录 
是 如 何 组 织 和 存储 的 。 本 章 将 先 察看 文件 系统 的 外 在 特征 . 接 下 来 分 析 它 的 内 部 结构 ,最 后 
学 习 相 应 的 系统 调用 的 功能 和 使 用 方法 。 
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4.2 从 用 户 的 角度 看 文件 系统 


4.2.1 目录 和 文件 


从 用 户 的 角度 来 看 ,Unix 系统 中 硬盘 上 的 文件 组 成 一 棵 目录 树 。 每 个 目录 能 包含 文件 
或 其 他 的 目录 。 图 4.1 是 树 的 一 个 永 例 。 

下 面 将 从 构建 这 个 有 目录 结构 开始 ,介绍 管 
理 这 些 文件 和 目录 树 的 Unix 命令 。 


4.2.2 有 目录 命令 


可 以 按照 下 而 的 命令 顺序 建立 如 图 4. 1 
所 示 的 这 棵 司 : 


demodir 








s mkdir demodir 

$ od demodir 

$ pd 

/ home/ yourname/experiments/demodir 
S mkdir b cops 
$mvbc 

s rmdir cops 

$ cde 

s mkdir dl d2 
geod .,/,. 

S mkdir demodir/a 


其 实 要 达到 同样 的 效 累 ,本 可 以 使 用 若干 其 他 的 命令 ,这 里 为 了 演示 而 故意 做 得 复杂 些 。 

按照 上 面 的 例子 建立 这 棵 树 。 人 例子 中 使 用 了 一 些 基 本 的 命令 ,mkdir 用 来 创建 一 个 指定 
的 生计 或 多 个 目录 。 思 考 以 下 问题 ,创建 一 个 和 已 有 交 件 或 日 录 同 名 的 日 录 将 会 怎样 ? 
rmdir 用 来 删除 一 个 目录 或 多 个 目录 ,删除 一 个 包含 子 目录 的 目录 会 发 生 什 么 事 呢 ? mv 用 
来 重 命名 一 个 目录 ,也 可 用 来 将 一 个 肌 录 从 一 个 地 方 移 到 另 一 个 地 方 。 

与 上 还 命令 不 同 的 是 cd 命令 不 对 目录 产生 影响 , 它 影 响 的 是 用 户 。cd 使 你 从 一 个 日 录 
转 到 另 一 个 日 录 , 就 如 间 你 从 一 个 房间 走 到 另 一 个 房间 。pwd 打印 出 当前 工作 目录 。 在 上 
面 的 例子 中 ，demodir 是 experiments 的 一 个 子 上 月 录 ; 而 experiments 位 于 yourname 之 下 ， 
yourname 位 于 home 之 下 ,home fr FS HZ F. RARR "RR. 


4.2.3 文件 操作 命令 
现在 在 这 裸 目 录 树 中 创建 一 些 文件 : 


S ed demodir 
$ cp /ete/qroup x 
S cat x 
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root; +0; 

bin: -1-bin, daemon 
users: ;200; 

$ cp x copy. of. x 

$ mv Copy. of. x y 

$ ede 

$ cp../a/x d2/xcopy 
5 ln .. /a/x di/xlink 
$ ls <> di/xlink 

5 cp dl/xlink z 

5 rmn ../../demodir/c/d2/../z 


$ cat demodir /a/x 
〈 想 想 接着 会 三 示 出 什么 ?) 


为 了 演示 各 种 文件 操作 命令 ,特意 没 计 了 上 述 命令 操作 序列 ,请 按照 上 面 的 步骤 自己 建 
立 文件 , 想 一 下 最 后 一 个 命令 会 产生 怎样 的 结果 。 这 个 重子 中 用 了 一 些 最 常用 的 文件 处 理 
命令 。cp 用 来 复制 一 个 文件 ,在 前 而 的 章节 中 已 经 编写 了 一 个 cp 的 简易 版 本 。cat 命令 将 
文件 内 容 复 制 到 标准 输出 文件 。mrv 命令 可 以 重 命名 一 个 文件 ,就 像 在 第 一 个 例子 中 那样 ; 
也 可 将 文件 移动 到 另 一 个 目录 ,就 像 在 第 二 个 例子 中 那样 。rzm 命令 删除 一 个 文件 ,请 注意 目 
录 路 径 可 能 包含 “. . "及 多 个 目录 元 素 。 符 号 “.. ”表示 上 一 级 日 录 , 央 父 目 洪 。 一 系列 用 单 
斜 杠 分 取 的 上 且 录 名 指出 了 能 到 达 指 定 对 象 的 一 条 路 经 ,注意 此 时 并 未 改变 用 户 所 狂 的 位 置 ， 
上 例 中 采用 这 种 间接 的 方法 删除 了 文件 “z”。 


demodir 





4,2 对 同一 文件 的 两 个 链接 


文件 的 复制 .显示 文件 的 内 容 和 重 命名 是 任何 计算 机 系统 都 会 提供 的 操作 , 而 命令 ln 则 
不 是 很 常见 ,但 它 却 是 Unix 的 一 个 基本 操作 。 如 在 上 例 中 生成 了 对 一 个 已 存在 文件 . . /ayx 
的 一 个 链接 ,这 个 链接 称 为 di/xlink。 如 图 4.2 所 示 , 称 为 x 的 项 位 于 目录 demodir/a 中 , 称 
为 xlink 的 项 位 于 目录 demodir/c/dl 中 。x 和 xlink 都 称 为 链接 。 一 个 链接 是 指向 文件 的 一 
个 指针 。.. /a/x 和 dl/xlink 都 指向 硬盘 上 同一 数据 块 。 上 例 中 ,下 一 个 命令 Is > dl/xlink 
将 is 的 输出 作为 文件 xlink HAR. AAMI cat.. /a/x 时 将 会 发 生 什 么 呢 ? 
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4.2.4 针对 目录 树 的 命令 
有 些 Unix 命令 是 对 整个 树 结构 进行 操作 ,以 下 是 一 些 例 子 : 


ls -R 





ls 命令 用 来 别 出 日 录 的 内 容 , 选 项 -R 要 求 列 出 指定 目录 及 其 子 目 录 的 所 有 内 容 。 在 前 
面 的 章节 中 已 经 给 出 了 一 个 js 的 版 本 ,但 要 完成 选项 -RR 要 求 的 功能 ,还 需要 做 一 些 工 作 。 


chmod —R 


chmod 命令 几米 修改 文件 的 许可 权限 位 ,选项 ~R 要 求 修 改 子 目录 中 所 有 文件 的 许可 
权限 。 


du 





du 是 disk usage( 硬 盘 使 用 ) 的 缩写 ,该 命令 给 出 指定 目录 及 其 子 目录 下 所 有 文件 占用 硬 
担 中 数据 块 的 总 数 。 


find 


find 命令 将 在 一 个 日 录 及 其 所 有 子 日 录 中 检索 符合 要 求 的 文件 和 目录 。 例 如 ,可 以 检索 
一 棵 目录 树 中 所 有 大 于 1MB、 上 周末 被 修改 过 ,可 被 所 有 用 户 阅 读 的 文件 。 

Unix 中 目录 树 是 文件 系统 的 一 个 重要 组 成 部 分 ,其 他 有 很 多 命令 都 跟 目录 树 有 关 , 读 者 
可 以 自己 试 荐 找 一 找 。 


4.2.5 自 录 树 的 深度 几乎 没有 限制 


目录 能 够 包含 多 个 文件 和 子 自 录 。 系 统 并 未 对 目录 树 的 深度 加 以 限制 。 但 是 ,有 可 能 
所 建 的 目录 树 太 深 以 至 超过 许多 命令 允许 的 范围 。 

注意 : 如 果 你 想 尝试 以 下 的 试验 ,请 在 自己 的 机 器 上 做 。 如 果 在 学 校 或 工作 地 点 进行 斌 
验 , 那 里 的 系统 管理 页 肯定 会 不 高 兴 。 

这 是 一 个 简单 的 命令 脚本 (关于 脚本 的 解释 详 见 第 8 章 )。 


while true 

do 
mkdir deep 一 well 
cd deep — well 


done 


即使 你 在 程序 运行 1.2 秘 后 就 按 下 Ctrl-C, 它 也 会 创建 一 个 非常 深 的 级 联 目 录 树 。 那 
A du 命令 对 这 个 级 联 日 录 会 产生 什么 效果 ? find 和 ls -及 命令 又 会 如 何 呢 ? 

fr Unix 的 很 多 版 本 中 ,下 述 命令 rm -r deep -well 将 不 起 作用 ,考虑 一 下 如 何 才能 删 
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4.2.6 Unix 文件 系统 小 结 


这 个 小 节 中 从 有 骨 户 的 角度 竟 察 了 Unix 的 文件 系统 。 硬 盘 目 呈现 了 一 个 能 够 在 深度 和 
沉 度 上 广泛 延伸 的 日 录 树 结构 ,Unix 提供 了 很 多 命令 来 和 这 种 结构 的 对 象 协同 工作 ， Unix 
系统 中 的 所 有 文件 都 存在 于 这 种 结构 中 。 

它们 是 如 何 工作 的 ? 自 录 是 什么 ?如何 知道 文件 所 处 的 日 录 ” 从 一 个 目录 转换 到 为 一 
TERERAA? pwd 如 何 得 知 你 当前 所 处 的 位 置 7 这些 问题 将 引导 下 面 的 学 习 。 


4.3 Unix 文件 系统 的 内 部 结构 


硬盘 实际 上 是 由 一 些 磁性 盘 片 组 成 的 计算 机 系统 的 一 个 设备 。 前 面 章节 中 所 旬 及 的 文 
件 系统 是 对 该 设备 的 一 种 多 层次 的 抽 乏 。 


4.3.1 第 一 层 抽 象 : 从 磁盘 到 分 区 


一 个 政 盘 能 够 存储 大 量 的 数据 ， 就 像 一 个 国家 能 被 划分 成 州 或 县 ,一 个 磁盘 可 被 划分 
成 分 区 ,以 便 在 一 个 大 的 实体 内 创建 独立 的 区 域 。 每 个 分 区 部 可 以 看 作 是 一 个 独立 的 侯 盘 ， 


4.3.2 第 二 层 抽 象 : 从 磁盘 到 块 序列 


一 个 硬盘 由 一 些 盛 性 盘 片 组 成 每 个 盘 片 的 表面 都 被 划分 为 很 多 同心 圆 ,这 些 同心 加 
称 作 磁 道 ,每 个 厂 道 又 进一步 被 划分 成 扇 区 ,就 像 郊 外 的 街道 被 划分 威 居 住 单元 。 每 个 鹿 区 
可 以 存储 一 定 字 节 数 的 数据 ,例如 每 个 扇 区 有 512 字 节 。 筷 区 是 磁盘 上 的 基本 存储 单元 , 现 
在 的 磁盘 包含 大 量 的 扇 区 。 图 4.3 显示 了 序列 号 是 如 何 分 配给 收盘 块 的 。 


HS SEER Jy 
Kr. ni 
得 磁盘 看 起 
HD TEL 
组 





01234567 89101)... 


图 4.3 ye RE 


为 磁盘 揣 编 号 是 一 种 很 重要 的 方法 。 给 每 个 磁盘 块 分 配 连续 的 编号 使 得 系统 能 够 计算 
磁盘 上 的 每 个 块 。 可 以 一 个 磁盘 接 一 个 磁盘 地 从 上 到 下 给 所 有 的 所 编号 ,还 可 以 一 个 磁道 
接 一 个 磁道 地 从 外 向 里 给 所 有 的 块 编号 。 就 像 给 每 条 街道 上 的 每 所 房子 编号 一 样 ,磁盘 上 
存储 数据 的 软件 给 磁盘 上 每 条 磁道 上 的 每 个 块 分 配 了 一 个 序号 。 

一 个 将 磁盘 遍 区 编号 的 系统 使 得 我 们 可 以 把 磁盘 视 为 一 系列 块 的 组 合 。 


4.3.3 第 三 层 抽象 : 从 块 序列 到 三 个 区 域 的 划分 
文件 系统 可 以 用 来 存储 文件 内 容 、 文 件 属性 (文件 所 有 者 .日 期 等 ;和 目录 ,这 些 不 同类 








第 4 章 文件 系统 , 编写 pwd - 101 * 











型 的 数据 是 如 何 存储 在 被 编号 的 磁盘 块 上 的 呢 ? 
Unix 使 用 了 一 个 简单 的 方法 。 如 图 4.4 所 示 , 它 将 这 些 磁盘 块 分 成 了 3 部 分 。 


BE UAE 数据 区 





2 


属性 存储 在 这 里 P153 7E E CEA IR. 
Bid 文件 系统 的 三 个 区 域 


一 部 分 称 为 数据 区 ,用 来 存放 文件 内 容 。 另 一 部 分 称 为 ij- 节 点 表 (inode table), ARF 
放 文 件 属性 。 第 三 部 分 称 为 超级 抉 (superblock) .用 来 存放 文件 系统 本 身 的 信息 。 文 件 系统 
由 这 3 部 分 组 合 而 成 ,其 中 任 一 部 分 者 是 由 很 多 有 序 磁 盘 块 组 成 的 。 

(1) BBR 

文件 系统 中 的 第 一 个 块 被 称 为 超级 蕊 。 这 个 扎 存 放 文 件 系 统 本 身 的 结构 信息 。 例 如 ， 
超级 块 记 录 了 每 个 区 域 的 大 小 。 超级 块 也 存放 未 被 使 用 的 磁盘 块 的 信息 。 不 同 版 本 Unix 
的 超级 块 的 内 容 和 结构 稍 有 不 同 , 可 以 察看 联机 帮助 和 头 文件 .以 确定 你 的 系统 的 超级 块 所 
. 包含 的 内 容 。 

(2) i WA 

文件 系统 的 下 一 个 部 分 被 称 为 i- 节 点 表 。 每 个 文件 都 有 一 些 属性 , 姐 大 小 .文件 所 有 者 
和 最 近 修 改 时 间 等 。 这 些 性 质 被 记录 在 一 个 称 为 -节点 的 结构 中 。 所 有 的 i- 节点 都 有 站 
同 的 大 小 ,并 且 -节点 表 是 这 些 结 枸 的 一 个 列表 。 文件 系统 中 的 每 个 文件 在 该 表 中 都 有 一 
个 i- 节 点 。 如 果 你 有 root 权限 ,就 可 以 像 操作 文件 一 样 将 分 区 打开 Dd OE o i D AX. 
在 显示 ump 文件 时 就 用 过 类 似 的 技术 ， 

以 下 这 一 点 很 重要 : 起 中 的 每 个 i- 节点 都 通过 位 置 来 标识 。 例 如 ,标识 为 2 的 ji- 节点 
(inode 2) 位 于 文件 系统 i- 节点 家 中 的 第 3 个 位 置 。 

(3) 数据 区 

文件 系统 的 第 3 PME RR. XCUEBO P3 VOR AE TE TKR. RA EA RAK 
都 是 一 样 的 。 如 果 文 件 包含 了 超过 一 个 块 的 内 容 , 刚 文件 内 容 会 存放 在 多 个 磁盘 块 中 。 一 
个 较 大 的 文件 很 容易 分 布 在 上 千 个 独立 的 磁 檀 块 中 。 那 么 ,系统 是 如 何 跟踪 这 些 独立 的 磁 
ARR? 


4.3.4 文件 系统 的 实现 : 创建 一 个 文件 的 过 程 


文件 的 内 容 和 属性 分 区 存放 的 想法 看 起 来 很 简单 ,但 实际 上 它 是 如 何 工作 的 呢 ? 创建 
一 个 产 文 件 的 时 候 又 会 发 生 什么 ? 考虑 以 下 命令 : 


S who > userlist 


当 这 个 命令 完成 时 ,文件 系统 中 增加 了 一 个 存放 命令 who 输出 内 容 的 新 文件 。 这 是 怎 
么 回 事 ? 
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文件 有 内 容 和 属性 ,内 核 将 文件 内 容 存放 在 数据 区 ,文件 属性 存放 在 ji- 节点 ,文件 名 存 
放 在 目录 。 图 4,5 显示 了 创建 一 个 文件 的 例子 ,这 个 新 文件 需要 3 个 存储 块 来 存放 各 部 分 的 
AE. 


在 -节点 中 存储 文件 信息 
存储 数据 块 序列 





增加 到 目录 的 人 口 目录 
627 | 200 | 992 | Soe 


文件 所 使 用 的 数据 块 列表 





Bao 文件 的 内 部 结构 


创建 一 个 新 文件 的 4 个 主要 操作 如 下 。 

COD 存储 属性 

文件 属性 的 存储 : 内 核 先 找 到 一 个 空 的 i- 节 点 。 图 4.5 中 ,内 核 找 到 ;~ 节点 47。 内 核 
把 文件 的 信息 记录 其 中 。 

C2) 存储 数据 

文件 内 容 的 存储 由 于 该 新 文件 需要 3 个 存储 碰 盘 块 ,因此 内 核 从 自由 块 的 列表 中 找 出 
3 个 自由 块 。 图 4.5 中 , 它 找到 块 627、200 和 992。 内 核 缓冲 区 的 第 一 块 数据 复制 到 块 627. 
下 一 块 数据 复制 到 块 200, 最 后 一 块 数据 复制 到 块 992， 

(3) 记录 分 配 情况 

文件 内容 按 顺 序 存放 在 块 527 .200 和 992 中 。 内 核 在 i- 节点 的 磁盘 分 布 区 记录 了 上 述 
的 块 序 列 。 磁 盘 分 布 区 是 一 个 磁盘 抉 序号 的 列表 ,这 3 个 编号 放 在 最 开始 的 3 个 位 置 。 

(4) 添加 文件 名 到 目录 

新 文件 的 名 字 是 userlist, Unix 如 何在 当前 的 目录 中 记录 这 个 文件 ? 答案 很 简单 。 内 
KA 47, userlist) 添加 到 目录 文件 。 文 件 名 和 i 一 节点 号 之 间 的 对 应 关系 将 文件 名 和 文 
件 的 内 容 及 属性 连接 了 起 来 。 这 个 问题 将 在 下 面 进一步 好 讨论 . 


4.3.5 文件 系统 的 实现 : 目录 的 工作 过 程 


目录 是 一 种 包含 了 文件 名 字 列 表 的 特殊 文件 。 不 同 版 本 的 Unix 目录 的 内 部 结构 不 同 ， 
但 是 它们 的 抽象 模型 总 是 一 致 的 一 一 一 个 包含 i- 节 点 号 和 文件 名 的 表 ， 
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i-tms 文件 名 
2342 
43989 x 
3421 hello, c 
533870 thyls. c 


(1) 探讨 目录 内 部 
可 以 通过 命令 ls -1ia( 选 项 第 一 位 是 数字 1) 来 看 是 录 的 内 容 : 


$ ls - lia deaodir 
177865 . 

529193 .. 

588277 a 

200520 c 

204491 y 

$ 


输出 的 是 文件 名 和 对 应 的 i- 节点 号 。 例 如 ,文件 各 y 对 应 于 i- 节 点 号 204491。 当 前 目 
RH“ ”家 示 ,i- 节点 号 是 177865。 这 意味 着 有 有 关 大 小 .文件 所 有 者 、 组 等 各 项 关于 当前 目录 
的 信息 存放 在 i- 节 点 表 中 的 编导 为 177865 的 结构 中 。 

ls 的 选项 -i 和 -1( 数 字 1 而 不 是 字母 |) 可 能 有 点 陌生 。 选 项 -i 告诉 ls 在 列表 中 包含 i 
-节点 号 ,选项 -1 要 求 每 行列 出 一 个 文件 ,在 demodir 版 本 上 尝试 这 个 命令 ,以 查看 所 得 到 
的 i- 节 点 号 。 

(2) 指向 同一 文件 的 多 重 链接 

可 以 使 用 命令 ls -i 查 看 系统 上 任何 一 个 文件 的 ji- 节点 号 。 例 如 ,可 以 查看 系统 上 根 电 
录 中 各 文件 的 -节点 号 ; 


S ls -ia/ 


2. 28673 etc il lost + found 438292 shlib 
2. s 311297 home 4097 mnt 40961 tmp 
3 auto 8832  home2 108545 opt 18433 usr 
26625 bin 24646 initrd 1l proc 10241 var 
403457 boot 24579 install 24681 root ^ 183 xfer. log 
225281 dev 161797 lib 233473 sbin 183 transfers 


这 个 列表 含有 两 个 重要 的 例子 。 第 一 ,在 右 下 角 有 被 称 为 xfer. log 和 transfers 的 两 个 
文件 。 这 两 个 文件 都 拥有 1- 节点 号 183， 因 此 ,两 个 文件 都 指向 同一 个 1- 节 点 。i- 节 点 实 
际 上 代表 了 一 个 文件 ,1i- 节 点 包含 了 文件 的 属性 和 数据 块 的 列表 。 因 此 , xfer. log 和 
transfers 是 同 -- 个 文件 的 两 个 不 同名 字 。 这 有 点 像 电话 笋 里 的 两 个 不 同 的 电话 号 码 所 对 应 
的 电话 机 有 可 能 在 同一 所 房子 4。 


Q 电话 藉 的 比喻 不 是 完全 恰当 ,内 为 两 个 木 同 的 人 邦 可 能 住 在 那个 房子 。 请 在 网 络 编 得 章节 中 了 解 port 的 概念 。 
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在 很 且 录 中 另 一 个 重要 的 例子 是 左上 和 角 的 “. “和 “..", 这 两 项 都 有 ;一 节 点 号 2, 所 以 “,” 
m ”都 指向 同一 个 目录 。 当 前 目录 怎么 会 和 父 虽 录 相 同 呢 ? 个 实际 上 在 大 多 数 情况 下 , 它 
们 是 不 同 的 , 根 昌 录 比较 特别 , 当 用 Unix 命令 mkfs 创建 了 一 个 文件 系统 ,mkls 将 根 目录 的 
父 目 录 指 向 自己 。 


4.3.6 文件 系统 的 实现 : cat 命令 的 工作 原理 


现在 已 经 看 到 了 创建 一 个 新 的 文件 时 内 部 所 发 生 的 事情 ,例如 who > userlist。 当 读 肥 
一 个 文件 时 又 会 发 生 什 么 呢 ? 读 取 命 令 如 何 工 作 ? 对 如 下 的 命令 ， 








5 cat userlist 


采用 从 目录 文件 一 步 一 步 找 到 数据 的 方法 来 加 以 了 解 ， 

(OD 在 目录 中 寻找 文件 名 

文件 名 存储 在 目录 文件 中 。 内 核 在 目录 文件 中 寻找 包含 字符 串 userlist 的 沁 录 。 
userlist 所 在 的 记录 包含 编号 为 47 的 ji 节点 号 ,如 图 4,6 所 示 。 


$ cat userlist 






从 文件 名 到 文件 内 容 : 
在 目录 中 寻找 文件 多 

使 用 编号 定位 i 节 点 

这 节点 包含 数据 块 的 

列表 


4.6 MXÍTA Slt p 


(2) 定位 ;~ 节点 4? 并 读 取 其 内 容 

内 核 在 文件 系统 中 的 i- 节 点 区 厂 找 到 i- 节 点 47。 定 位 一 个 i- WA KBR "m" 
的 计算 ,所 有 的 i- 节 点 大小 相同 ,每 个 磁盘 块 都 包含 相同 致 量 的 j- 节 点 。 为 了 提 疝 访问 效 
F AGATE I- 节点 置 于 缓冲 区 中 。i- 节 点 包含 数据 块 编号 的 列表 。 

(3) 访问 存储 文件 内 容 的 数据 块 

通过 以 上 过 程 ,内 核 已 经 可 以 知道 文件 内 容 存放 在 哪些 数据 块 上 ,以 及 它们 的 顺序 。 由 
于 cat 不 断 地 调用 read 了 师 数 ,使 得 内 核 不 断 将 字 节 从 琵 盘 复制 到 内 核 缓冲 区 ,进而 到 达 用 户 
空间 ， 

所 有 从 文件 读 中 数据 的 命令 ,例如 cat, cp, more. who 等, 都 是 将 文件 名 传 结 open 来 坊 


O E5 Latham & Jalfe Hm) Im My Own Grandpa. 1947 对 相关 主题 的 讨论 。 
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问 文件 内 容 。 对 open AYA VERI RECEP HOC HE RGAE Bag ics 
获得 文件 的 属性 ,最 终 找 到 文件 的 内 容 ， 

现在 可 以 想象 一 下 在 open 一 个 没有 读 或 写 权 限 的 文件 时 将 发 生 什么 情况 。 内 核 首先 根 
ELFARI i- 节 点 号 ,然后 根据 ji- 节点 号 找到 i- 节 点 。 在 i- 节 点 中 ,内 核 找到 文件 的 权 
Hi 70 BEC EO JP TD。 如 果 权 限 位 设置 你 的 用 户 TD 对 文件 没有 访问 权限 , 则 open 返回 
一 1 并 且 将 全 局 变 扰 errno 的 值 设 为 EPERM, 

通过 对 目录 .i- 节 点 和 数据 块 的 描述 ,相信 能 提高 对 其 他 的 文件 操作 的 理解 。 可 以 通过 
阅 沪 一 些 版 本 的 Unix 系统 源 代码 来 加 以 检验 ， 


4.3.7. ji 节点 和 大 文件 


Unix 文件 系统 如 何 跟踪 大 文件 呢 ” 其 实 前 一 个 章节 中 的 解释 并 不 完整 。 简 短 地 说 , 问 
题 是 : 
事实 1 —TÁAMBICURGE REA BA 
事实 2 在 ;- 节 点 中 存放 有 磁盘 块 分 配 列表 
问题 。 一 个 固定 大 小 的 -节点 如 何 存储 较 长 的 分 配 列 家 7 
HENK 。 将 分 配 列表 的 大 部 分 存储 在 数据 块 ,在 i- 节 点 中 存放 指向 那些 块 的 指针 。 

DEE 4. 7 中 描述 的 解决 方案 。 这 个 文件 需要 14 个 数据 块 存储 它 的 内 容 。 因 此 ,分 配 
链表 包含 14 个 块 的 编号 。 但 是 很 遗 屋 ,文件 的 i 节 点 只 包含 一 个 含有 13 个 项 的 分 配 链表 。 
14 个 编号 如 何 放 到 13 个 项 中 呢 ? 其 实 很 简单 。 将 分 配 链表 中 的 前 10 个 编号 放 到 i- 节点 
中 ,将 最 后 4 个 编号 放 到 一 个 数据 块 中 。 这 有 点 像 把 某 些 货物 放 在 架子 上 而 把 剩 下 的 放 在 仓 
库 里 。 

更 具体 她 说 ,就 是 该 i- 节 点 的 链表 包含 分 配 13 个 块 编号 的 空间 ,链表 里 的 前 10 个 项 像 









[Y usées e 
Weel, 2 s 
peal SPD He 
md UU 的 编号 ， 这 个 

Hs =m 


PABA 7 ”分 配 列表 在 间接 ” 块 12 存 信和 着 包含 更 多 PER. 
Apeh APRS. Pein ”间接 块 的 那个 数据 块 
TH. 存储 着 那个 块 的 的 编号 : 这 个 块 被 称 

编号 。 fi — rtu] FR 


= 84.7. 在 数据 区 延伸 的 块 分 配 列表 
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“ha F 2s [6] "-———24€ 3E 10 AXE p B3 a a SE reg B RB. MRT AERA ET 
10 个 的 项 , 则 剩 下 的 块 编 另 不 是 存储 在 TO 节点 :而 是 存储 在 数据 区 。 存放 多 余 编号 的 数据 
块 的 编号 存储 在 ~ 节点 的 第 11 个 项 中 一 一 就 像 书店 里 有 个 使 条 贴 在 架子 上 写 背 “ 剩 下 的 货 
物 在 仓库 的 3 号 架子 上 ”。 

注意 到 这 个 文件 实际 上 用 了 15 个 数据 块 。 其 中 14 个 用 来 存储 文件 的 内 容 , 剩 下 的 1 个 
存放 着 i- 节点 的 分 配 链 表 元 法 在 让 的 韶 部 分 内 容 。 这 个 额外 的 块 被 称 为 闻 接 块 。 

(1) 间接 块 饱 和 时 如 何 姓 理 ? 

当 越 来 越 多 的 字 节 被 添加 至 文件 ,内 核 将 分 配 更 多 的 数据 块 ,因此 分 配 列表 越 来 越 长 ， 
需要 更 多 的 存储 空间 。 分配 列表 迟早 会 充满 间接 上 央 , 上 所 以 内 核 将 开始 引入 第 二 个 额外 块 。 
内 核 将 如 何 处 理 第 二 个 额外 块 的 块 编号 ”内核 需 将 第 二 个 癌 接 块 的 编号 放 入 i- 节点 的 第 12 
个 项 中 吗 ? 可 以 这 么 做 ,但 基 这 样 意 妹 善文 件 仪 能 含有 3 个 额外 块 。 实 际 上 ;内 核 并 不 把 第 
二 个 额外 块 的 编导 放 人 i9 守 点 ,取而代之 的 是 ,内 核 开 辟 另 外 一 个 块 来 存放 这 些 额外 间接 块 
的 列表 。i- 节 点 的 第 12 项 并 不 存放 第 二 个 额外 块 的 编号 ,而 是 存放 孝 个 存储 着 第 2、,3、4 太 
后 继 额 外 块 的 编号 的 块 的 编导 。 这 个 块 被 称 为 二 级 间接 块 。 

(2) 二 级 间接 块 饱和 堵 如 何 处 理 ? 

当 志 级 间接 块 饱和 时 ,上 内核 开 辟 另 一 个 新 的 二 级 间接 块 。 内 核 并 不 把 这 个 新 的 间接 二 
级 其 的 编号 放 人 ii 节点 的 列表 。 而 是 创建 一 个 三 级 问 接 块 来 存放 二 级 间接 块 的 编导 以 及 这 
个 文件 将 来 所 需要 的 所 有 间接 二 级 决 的 编号 。i- 节 点 列表 的 最 后 一 项 正 是 记录 着 这 个 三 级 
间接 块 的 编号 。 

(3) 三 级 间接 块 饱 和 时 又 将 如 何 处 理 ? 

文件 到 达 了 极限 。 如 果真 想 使 用 大 文件 ,可 以 创建 一 个 由 更 大 的 磁盘 块 构成 的 文件 系 
统 。 当 创建 该 文件 系统 时 ,不 仅 能 够 定义 i- 节点 表 和 数据 区 的 大 小 ,而 且 能 够 定义 磁盘 瑞 的 
大 小 。 磁 盘 抉 并 不 需要 和 各 磁 副 扇 区 同样 大 小 ,通常 一 个 磁盘 块 包 含 若干 个 局 区 。 

由 于 大 文件 的 存储 管理 需要 更 多 的 开销 ,因此 这 样 的 磁盘 分 配 系 统 对 小 文件 来 说 是 快 
捷 高 效 的 。 当 文件 连 步 增长 时 ,内 核 使 用 更 多 的 磁盘 空间 去 维护 越 米 越 长 的 分 配 列 表 。 在 
文件 中 定位 一 个 特定 的 位 置 可 能 需要 获取 若干 个 间接 块 以 得 到 数据 块 的 编号 。 


4.3.8 Unix 文件 系统 的 改进 


前 一 小 节 描 述 了 Unix 文件 系统 的 结构 。 不 同 版 本 的 Unix 使 用 这 种 模型 的 不 同 版 本 。 
这 个 经 典 的 简洁 方法 有 些 严重 的 不 足 之 处 。 例 如 ,超级 块 就 是 一 个 问题 。 如 果 这 个 块 损坏 
了 , 则 整个 文件 系统 的 结构 信息 就 没有 了 ,新 版 本 的 Unix 在 文件 系统 中 备份 了 这 个 块 的 
副本 。 

分 块 是 男 一 个 问题 。 由 十 文件 的 创建 和 删除 ,自由 块 将 遍布 磁盘 。 一 种 方案 是 在 文件 
系统 中 创建 被 称 为 柱 面 组 Ceylinder group) 的 微 文 件 系统 。 

组 是 这 个 经 典 的 模型 并 末 过 时 。 文 件 仍旧 存储 在 数据 区 的 块 中 ,文件 属性 仍旧 存储 在 i 
-PARP INP ATI PAS SRR SRR: 目录 仅 是 文件 各 和 ji- 节点 号 的 列 
表 。 现 在 再 来 回顾 一 个 在 前 面 ` 章 中 所 创建 和 探讨 的 目 法 树 。 在 理解 TREA ee A 
构 以 后 ,再 看 目录 利文 件 的 结构 就 很 清楚 了 。 
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4.4 PU A OR 


在 了 解 了 一 个 Unix 文件 系统 的 目录 结构 之 后 ,就 能 够 知道 日 录 树 究竟 是 怎么 回 事 ,并 
且 能 够 理解 不 同 的 晶 录 命令 是 如 何 工 作 的 。 


4.4.1 理解 目录 结构 


用 户 看 到 的 文件 系统 是 目录 和 子 目 水 的 集合 。 每 个 日 录 能 够 包含 文件 和 子 自 录 , 每 个 
子 卓 录 有 一 个 父 目 录 ,这 棵 树 的 结构 常用 线条 连 搂 的 方块 图 来 表示 。 文 件 在 一 个 目录 中 是 
什么 意思 ? 专业 术语 “dl 是 ec 的 一 个 子 旧 录 ? 又 是 什么 意思 ? 图 上 的 线条 代表 什么 意思 ? 

在 文件 系统 内 部 ,目录 是 一 个 包含 文件 名 与 1- 节 点 对 的 列表 的 文件 。 从 用 户 的 角度 看 
到 的 是 :个 文件 名 的 列表 ,向 从 Unix 的 角度 看 到 的 是 一 个 被 命名 的 指针 的 列表 ,如 图 4.8 
BUR. 

APR 系统 角度 一 
demodir 7 

[| 

[| | 





pan 
[i xlink | | [xcopy | 
图 4.8 目录 树 的 两 种 不 同 视图 


如 何 从 用 户 的 角度 转换 到 系统 的 角度 ? 通过 在 图 中 添加 i- 节点 号 ,就 能 够 了 解 日 录 树 
是 如 何 连接 在 一 起 的 。 使 用 ls -iaR 可 以 列 出 一 棵 树 中 的 所 有 文件 的 i- 节点 导 。 


$ ls - iaR demodir 


865 , 193 Ae 277 a 520 c 491 y 
demodir/a: 

277 . 865 - 402 x 

demodir/c; 

520 . 865 Bae 651 di 247 d2 
demodir;/c/dl: 

$51 . 520 ix 402 xlink 

demodir/c/d2;: 

247 . 520 Ls 680 xcopy 


$ 
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图 4.9 是 上 例 的 图 示 ， 


用 pa fh n 系统 角 n 


demodir | 49) [7 





图 4.9 文件 名 和 指向 文件 的 指针 


(1)“ 文 件 在 目录 中 ”的 真正 舍 义 

一 般 都 说 文件 存放 在 某 个 目录 中 ,但 是 现在 已 经 知道 目录 中 存放 的 只 是 文件 在 ji- 节 点 
表 的 人 口 ,而 文件 的 内 容 则 存储 在 数据 区 。 文 件 在 某 个 目录 中 是 什么 意思 ? 例如 ,从 用 户 的 
角度 来 看 ,文件 y 在 目录 demodir 中 .而 从 系统 角度 来 看 ,看 到 的 则 是 目录 中 有 一 个 包含 文件 
42yMi-pass 491 的 入 口 。 

类 似 地 , “文件 x XE BR a 中 ”意味 车 在 目录 a 中 有 一 个 指向 77503 ER 402 的 链接 ,这 个 链 
接 所 人 附加 的 文件 名 为 x， 注意 ,这 一 点 很 重要 ,在 左 端 较 低 处 标 为 dl 的 目录 包含 一 个 指向 i 
-节点 402 的 链接 ,那个 链接 被 称 为 xlink。 称 为 demodir/a/x 的 链接 和 称 为 demodir/c/dl/ 
xlink 的 链接 指向 同一 个 文件 。 

简短 地 说 ,目录 包含 的 是 文件 的 引用 ,每 个 引用 被 称 为 链接 。 文 件 的 内 容 存 储 在 数据 
3h ,文件 的 属性 被 记录 站 一 个 被 称 为 i= 节点 的 结构 中 ,i~ 节 点 的 编号 和 文件 名 存 镶 在 目录 
H., “ARAS TEAR” HMAS. 

(2) "H3kt S TAR EGER X 

从 用 户 的 角度 来 看 ,目录 8 是 目录 demodir 的 一 个 子 目录 ,那么 在 系统 内 部 究竟 是 如 何 
运作 的 呢 ? 实际 上 demodir 包含 一 个 指向 那个 子 目 录 i- 节 点 的 链接 。 从 系统 角度 来 看 ,最 
上 面 一 个 表 包 含 一 个 指向 1- 节 点 277 OTE A a. MR 277 是 左边 那个 县 录 的 1- 
节点 号 呢 ” 每 个 目录 都 有 一 个 i- 节 点 ,内 核 在 每 个 目录 都 设置 一 个 指向 且 录 本 身 的 1- 节点 
HAD; 这 个 人 口 被 称 为 “.”。 在 左边 的 小 方 枢 中 ,点 表示 1- 节点 277, 因 此 左边 的 目录 表示 
i 一 节点 277, 

如 图 4. 10 所 示 ,i 一 节点 520 的 目录 是 如 何 被 包含 在 demodir 中 的 . 它 在 目录 demodir 中 
的 名 字 被 标识 为 <。 类 似 地 ,i- 节 点 247 是 另 一 个 目录 ,名 字 为 岂 , 它 是 -节点 520 的 一 个 
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RP fe 系统 角度 
demodlr 





图 4.10 HstA BI ROBE 


(3)“ 目 录 有 一 个 父 目 录 ” 的 真正 含义 

从 用 户 的 角度 看 目录 d2, 它 的 父 目 录 是 c。 这 里 再 次 用 一 个 指向 ij- 节点 的 简单 链接 实 
现 ,目录 c 的 i- 节 点 号 为 520, 目 录 d2 包含 一 个 称 为 “. . ”的 人 口 。 这 个 入口 的 i- 节 点 号 是 
520。“.. ”是 父 目 录 的 保留 名 字 。 因 此 ,i- 节 点 520 是 -节点 247 的 父 节点 。 

(4) 填充 空白 的 -节点 号 

如 果 理 解 了 前 面 的 章节 , 接 下 来 就 能 够 填充 图 4. 10 中 的 空余 的 1- 节点 号 ， 如 果 不 知道 
这 些 空白 处 该 填 什么 ,可 以 查看 一 下 ls 的 输出 内 容 并 复习 一 下 前 面 章节 的 内 容 。 

CO 多 重 链接 及 链接 数 

在 demodir 目录 树 中 ,i- 节 点 402 有 两 个 链接 。 一 个 是 在 目录 a 中 , 称 为 x, 另 一 个 在 中 
录 dl 中 , 称 为 xlink。 那 么 哪个 是 原始 文件 ? 哪个 是 指向 它 的 链接 呢 ? 在 Unix 的 目录 结构 
中 ,这 商 个 链接 的 状态 完全 相同 ; 它们 被 称 为 指向 文件 的 硬 链接 。 文 件 是 一 个 i- 节 点 和 一 
些 数据 块 的 结合 ; 链接 是 对 i- 节 点 的 引用 。 可 以 对 一 个 文件 创建 任意 多 的 链接 。 

内 核 记录 了 一 个 文件 的 链接 数 。 就 -节点 402 来 说 ,链接 数 至 少 是 2。 因 为 在 文件 系统 
的 其 他 部 分 或 许 还 存在 着 i- 节 点 402 的 其 他 链接 。 链 接 数 被 记录 在 i- 节 点 中 ,同时 是 系统 
调用 stat 返回 值 stat 结构 中 的 一 个 成 员 。 

(6) 文件 名 

在 Unix 的 文件 系统 中 ,文件 没有 文件 名 ,但 是 链接 具有 名 字 。 文 件 仅仅 拥有 i- 节点 号 。 
在 后 面 的 章节 中 ,可 看 到 这 种 方法 的 便利 之 处 。 


4.4.2 与 目录 树 相关 的 命令 和 系统 调用 


Unix 文件 系统 的 内 部 结构 比较 简单 ,仅仅 是 一 些 相 扎 链 接 的 数据 结构 。 节 点 被 称 为 i- 
节点 ,指针 的 集合 被 称 为 上 日 录 ,叶子 节点 被 称 为 链接 。 通 过 标准 的 Unix 命令 来 对 这 个 树 状 结 
构 进 行 管理 ,例如 mkdir, rmdir,mv,in 和 rm 等 。 这 些 命令 是 如 何 工 作 的 呢 ? 它们 将 使 用 哪 
些 相关 的 系统 调用 呢 ? 
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(1) mkdir 
命令 mkdir Fia e & o Hk, EHE f ERIT Ir sce T ARS AEA mkdir 系统 
调用 : 





























mkdir 
目标 创建 日 录 
xxt o # include < sys/stat, hz» g 
# include <sys,/ types, h> 
函数 原型 J int result = mkdir(char * pathname, mode_t mode) 
参数 ot hoaine 新 目录 名 sau 
mode 权限 位 的 掩 码 
返回 信 -1 — BAGR 
Q 成 功 创建 


mkdir 创建 一 个 新 的 目录 节点 并 把 它 链接 至 文件 系统 树 。 即 mkdir Gs Fx Hoe i 
-节点 ; 分 配 了 一 个 磁盘 块 用 以 存储 它 的 内 容 ; 在 日 录 中 设置 贞 个 入 [i.". ”和 和“ . ”并 应允 
配置 了 它们 的 i PRS; 在 它 的 父 日 录 中 增加 一 个 该 节点 的 链接 。 

(2) rmdir | 

命令 rmdir 用 来 删除 一 个 目录 。 它 接受 命令 行 上 一 个 或 多 个 目录 名 ,使 用 rmdir 系统 
调用 : 
































rmdir 
目标 MR TAR. WALA 
头 文件 井 inelude <<unistd. h= 
务 数 原型 "int result — rmdir (const char + path); 
参数 path 目录 名 
18 fl tà ==" 遇 到 错误 
0 上 成功 删除 


rmdir 从 日 录 树 中 期 除 一 个 目录 节点 。 这 个 目录 必须 是 空 的 。 即 除了 ".” 和 ”*. .” 的 人 
口 ,这 个 目录 不 能 包含 其 他 任 条 的 文件 和 子 目 录 。 同 时 在 父 目 录 中 删除 这 个 目录 的 链接 ， 
如 果 这 个 目录 本 身 并 未 被 其 他 的 进程 占用 , 它 的 i- 节 点 和 和 数据 记 将 被 释放 。 

(3) rm 

命令 rm 用 来 从 一 个 目录 文件 中 删除 -: 个 记录 , 它 接受 命令 行 上 一 个 或 客 个 文件 和 名 ,使 
用 unlink 系统 调用 : 









































unlink 
目标 删除 -个 链接 
头 文件 i # include < unistd. hz 
n CLIE int result = unlink (const char. * path); 
参数 path “ 需 删 除 的 链接 各 
i& I! fi —] 衣 到 错误 


0 成 功 删 除 
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unlink 用 来 删除 目录 文件 中 的 一 个 记录 ,减少 相应 i- 节点 的 链接 数 。 如 果 该 i 一 节点 的 
链接 数 减 为 09, 数据 块 和 i- 节 点 将 被 释放 。 如 果 该 i- 节 点 有 其 他 的 链接 , 则 数据 块 和 i 一 节 点 
将 不 受 影响 。unlink 不 能 被 用 来 删除 日 录 。 

(4) In 

命令 In 用 来 创建 一 个 文件 的 链接 ,使 用 系统 调用 link: 


link 





























Ae 创建 “个 文件 的 新 链接 
Sk c # include <unistd, h> 
函数 原型 int result = link (const cl char * orig, const char * new); 
参数 orig 原始 链接 的 名 字 
new 新 建 链接 的 名 宇 
i& El i 一 1 遇 到 错误 
0 成 功 创建 


link 生成 一 个 i- 节 点 的 链接 。 新 链接 包含 原始 链接 的 ji- 节点 号 并 且 具 有 特定 的 名 字 
如 果 已 经 存在 一 个 和 新 链接 名 相同 的 链接 , 则 link 将 失败 。link 不 能 被 用 来 生成 目录 的 新 链 
接 。 

(5) mv 

命令 mv 用 来 改变 文件 和 日 录 的 名 字 或 位 置 ， 是 这 小 节 中 所 讲述 的 最 为 灵活 的 一 个 命 
令 。 在 很 多 情况 下 ,mv 仅仅 使 用 系统 调用 rename; 


rename 























目标 重 命名 或 删除 一 个 链接 
头 文件 # include <Cunistd, h> 
LEE E] int result = rename (const char * from, const chars to); 
参数 from 原始 链接 的 名 字 
to 新 建 链接 的 名 字 
返回 值 一 1 ETE 
0 成 功 返 回 


rename 用 来 改变 文件 或 目录 的 名字 或 位 置 ， 例 如 ,renametd "y", "y, old") 用 来 改变 文 
件 的 名 字 ,而 renamel "y", "c/d2/y. old") 用 来 改变 文件 的 名 字 和 位 置 。rename 适用 于 文件 
税目 录 , 但 是 在 进行 目录 移动 时 有 些 限 制 。 例 如 ,不 能 将 一 个 目录 移动 到 它 的 子 昌 录 中 去 。 
考虑 一 下 rename( "demodir/c", "demodir/d2/c 4 Z P^ ^E "ETE S I XS 38 link 不 同 ， 
rename 将 删除 第 一 个 参数 所 指定 的 已 存在 的 文件 或 空 自 录 ， 

rename 是 如 何 将 一 个 文件 移动 到 另 一 个 目录 的 蛇 ? 文件 实际 上 并 不 存在 于 目录 中 ,上 自 
录 中 存 疼 的 仅仅 是 它 的 链接 。 凡 此 ,rename 将 链接 从 一 个 目录 移动 到 另 一 个 目录 。 将 目录 
y 移动 到 c/d2/y. old 看 起 来 就 像 图 4. 11 Bron 
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rename (“y”."c/dl/y.old” ) 执 行 之 后 





图 4.11” 将 文件 移动 到 新 的 凡 录 . 


首先 ,在 demodir 中 存在 着 一 个 指向 i- 节点 491 的 链接 , 称 为 y。 然 后 ,一 个 称 为 y. old 
的 指向 i 节点 的 链接 出 现在 c/d2 中 ,而 原来 的 链接 消失 了 。 内 核 是 姐 何 移动 这 些 链 接 的 呢 ? 

在 Linux [AX , rename MEAP BE: 

。 复制 链接 至 新 的 和 名字/ 位 置 

。 删除 原来 的 链接 

Unix 提供 系统 调用 link 和 unlink 完成 这 两 个 操作 。 因 此 ,rename("x"，"z") 是 这 样 返 
作 的 : 


if ( limk("x", "77) l= -1) 
uni ink( "x"); 


实际 上 ,过 去 没有 rename 这 个 系统 调用 ;内 此 命令 mv 使 用 系统 调用 link 和 unlink, XE 
内 核 中 增加 系统 调用 rename 解决 了 两 个 问题 ， 首 先 ,rename 使 得 重 命名 或 重 定位 一 个 目录 
变 得 更 加 安全 。 过 去 ,一 般 的 用 户 不 能 对 目录 进行 link 或 unlink 操作 ,因此 他 们 没有 办 法 重 
命名 一 个 目录。 

另 一 个 使 用 rename 的 优点 是 支持 非 Unix 文件 系统 。 在 Unix 中 , 重 命 名 一 个 文件 或 目 
录 是 通过 改变 链接 完成 的 ,但 是 其 他 的 系统 可 能 不 按 这 种 方式 工作 。 将 通用 方法 rename 其 
加 至 内 核 隐 藏 了 实现 的 细节 ,使 得 相同 的 代码 能 够 在 各 种 文件 系统 上 运行 。 

(6) ed 

ed 用 来 改变 进程 的 当前 目录 。ed 对 进程 产生 影响 ,但 是 并 不 影响 目录。 一 个 用 户 可 能 
会 说 :“ 我 进 人 了 /tmp 目录 ,发 现 一 大 堆 的 垃圾 文件 ", 而 另 一 个 用 户 可 能 会 说 ,“ 我 进 人 了 疼 
楼 ,发现 了 很 多 旧书 ”。cd 使 用 系统 调用 chdir: 
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chdir 
目标 改变 所 调用 进程 的 当前 目录 
Kee include «unistd, h> — 

i 函数 原型 int result = chdir (const char * path); 
参数 pah ”要 到 达 的 目录 
返回 值 —1 过 到 错误 
0 成 功 改变 . 
Unix 上 的 每 个 运行 程序 都 有 一 个 当前 目录 ,ehdir 系统 调用 改变 进程 的 当前 目录 。 在 系 


统 内 部 ,进程 有 一 个 存放 当前 目录 ji- 将 点 号 的 变量 。 从 一 个 目录 进入 另 一 个 目录 只 是 上 性 恋 
那个 变量 的 值 。 

ff cd.. 如 何 工作 .使 用 demodir 这 个 例子 ,假设 现在 位 于 一 个 称 为 c 的 目录 ,那么 , 当 
前 目录 的 i- 节 点 号 是 多 少 ? 如 现在 输入 cd dl1, 则 当前 目录 的 i- 节 点 号 是 多 少 ? 内 核 是 如 何 
获得 这 个 值 的 呢 ? 如 果 随 后 输入 cd ../.., 则 当前 目录 的 i- 节 点 号 又 是 多 少 ? 内 核 合 用 了 
什么 步骤 获得 该 i- 节点 号 ? 

如 果 知 道 如 何 完 成 这 个 重要 的 练习 ,那么 已 经 明 上 自命 令 pwd 是 刘 何 工作 的 了 。 


4.5 54 5 pwd 


命令 pwd AX dos $)i5 24 Bi EL se 89 Be. d in. on Ei F demodir/c/d2 3$ AMA 
pwd, 就 可 以 看 到 : 


$ pwd 
/hone/ yourname/experiments/demodir/e/d2 


这 么 长 的 路 径 存放 在 哪里 呢 ? 其 实 它 并 不 位 于 当前 的 目录 中 。 当 前 目录 称呼 本 身 为 
“.”, 并 且 有 一 个 i- 节 点 号 。 目 录 仅 是 相互 连接 的 节点 集合 中 的 一 个 节点 。pwd 如 何 知道 该 
目 某 是 c2,c2 的 父 日 录 是 eye 的 父 日 录 是 demodir W? i 


4.5.1 pwd 的 工作 过 程 


就 像 本 章 中 所 有 问题 的 答案 一 样 ,这 个 问题 的 答案 也 是 简单 的 : 追踪 链接 , 读 取 日 录 , 一 
个 目录 接着 一 个 昌 肝 地 沿 着 树 向 上 追踪 ,每 步 查看 “.” 的 i~- 节 点 号 ,然后 在 父 目 录 中 查找 该 i 
-节点 的 名 字 , 直 到 人 到达 树 的 顶端 。 如 图 4. 12 所 示 。 

从 当前 日 录 ( 就 是 右 下 角 的 那个 目录 ;开始 下 潮 。 在 该 日 录 当 中 ,所 外 位 种 的 名 称 为 
“. ”拥有 ji 节点 号 247。 现 在 利用 chdir 向 上 到 达 父 目录 ,查找 含有 ji- 节 点 247 的 人 口 E 
父 目录 中 ,i 一 节点 247 称 为 42。 因此 ,路 径 的 最 后 一 项 是 d2。 父 日 了 录 的 名 字 是 什么 呢 ? 在 父 
目录 中 , 它 的 名 字 是 “.”, 拥 有 i- 节 点 号 520。 通 过 chdir 进 人 它 的 父 目 录 , 可 以 看 到 j- 节 点 
520 名 字 为 c。 因此, 路径 的 最 后 两 项 是 c/d2。 算 法 是 以 下 3 个 步骤 的 重复 。 


«114 o Unix/Linux 编程 实践 教程 





6 1, “1 247 
a 5 chair, . 
[491] Y — | 2. 247 b^ d2" 
chair. . 
[330]- E) 4. 520 Se" 
mr EL iS 
[402|xX | eet tet 3 chair, . 
8. 865 E PRA“ demodir" 
" chair, . 
-一 上 一 EM ^06 
[402 | xtink | [ 680 [xcopy chair, . 


W412 计算 当前 路 径 


CD Ba". ”的 1- 节 点 号 , 称 其 为 n( 使 用 stat), 

(2) chdir, . (使 用 chdir), 

(3) RB i- FAS n BES = CEA opendir.readdir.closedir), 

重复 (直到 到 达 树 的 顶端 ) 。 

这 腹 起 来 很 简单 ,但 是 也 有 两 个 问题 。 

问题 1, 如 何 知 道 已 经 到 达 了 树 的 顶端 ” 在 一 个 Unix 文件 系统 的 根 目 录 中 ，- ”和 ”..” 
指向 同一 个 i- 节点 。 编 程 者 通常 将 下 一 个 指针 置 为 NULL, 用 来 标识 个 链表 结构 的 结束 。 
Unix 的 设计 者 本 可 以 将 根 目 录 的 “. ,” 置 为 空 , 但 是 还 是 决定 将 它 指 向 本 身 。 考 虑 一 下 这 个 
设计 的 优点 是 什么 ? 回 到 刚才 的 问题 ,基于 以 上 原因 ，pwd 命令 重复 循环 直到 一 个 目录 的 
“ras. .” 的 i~ 节 点 导 相 同时 ,就 可 以 认为 已 经 到 达 文 件 树 的 顶端 。 

问题 2: 如 何以 正确 的 顺序 显示 是 录 和 名 字 ? 可 以 建立 一 个 循环 ,使 用 street 或 sprintf 建 
立 目 录 名 字 的 字符 串 序 列 。 通 过 一 个 递归 的 程序 逐步 到 达 树 的 顶端 来 一 个 接 一 个 地 显示 目 
录 名 ,从 而 避免 了 字符 串 的 管理 ， 


4.5.2 pwd 的 一 种 版 本 


/* spw«d,c; a simplified version of pwd 

x 

* starts in current directory and recursively 
* climbs up to root of filesystem, prints top part 
* then prints current part 
* 

* uses readdir() to get info about each thing 
x 
x bug: prints an empty string if run from "/" 
并 x/ 

H include <Cstdio. hz» 

H include <Usys/types. h> 

# include — «sys/stat.hz 


第 4 章 文件 系统 : 编写 pwd 


# include <(dirent. h> 


ino t get inode(char * ); 
void printpathtotino t); 


void inum to name(ino 七 char * , int); 


int main() 


í 


printpathto( get inode( "." ) ); /* print path to here x/ 
putchar( '\n') ; /* then add newline x/ 
return 0; 


void printpathto( ino t this_inode } 
/* 
* prints path leading down to an object with this inode 
* kindof recursive 
xf 
1 
ino t my inode ; 
char its name[BUFSIZ]; 
if ( get inode(".,") !- this inode) 


{ 


chdir( ".." ); /* up one dir «/ 
inum to name(this inode,its name,BUFSIZ); /* get its name «/ 
my inode = get inode( "." Jj; /* print head x/ 
printpathto( my inade ); /* recursively «/ 


printf("/ € s", its name }; /* now print #/ 


Fr 
/* name of this */ 


j 
void imum to name(ino t inode to find , char x namebuf, int buflen) 
i* 
* looks through current directory for a file with this inode 
# number and copies its name into namebuf 
*/ 
{ 
DIR * dir ptr; /* the directory x/ 
struct dirent + direntp; ' Jx each entry x/ 
dir ptr = opendir( "."); l 
if ( dir ptr == NULL ){ 
perror( "." j. 
exit(1); 
} 
/* 
* search directory for a file with specified inum 
x! 
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while ( ( direntp = readdir( dir ptr} } ! = NULL) 
if ( direntp—»d ino == inode to find? 
1 


strncpy( namebuf, direntp —-d name, buflen); 
namebuf[buflen 1] = 'X0^; /x just in case «/ 
closedir( dir ptr ); 
return; 
t 
fprintf(stderr, "error looking for imm * din", inode to find); 
exit(1); 
} 
ino t get inode( char * fname } 
oe 
* returns inode number of the file 
xf 
{ 


struct stat info; 


if ( stat( fname , &info ) == -1 ){ 
fprintf(stderr, "Cannot stat "); 
perror( fname); 
exit(1); 


} 


return info.st ino; 


} 
下 面 是 命令 pwd 与 spwd 执行 后 的 比较 : 


$ /bin/pwd 
/home/bruce/experimentz/demodir/c/d2 
$ spwd 

/ bruce/experiments/demodir/c/d2 

$ 


命令 pwd 将 显示 到 达 树 根 的 路 径 , 而 这 个 版 本 在 到 达 树 根 之 前 就 停止 了 。 问 题 在 哪儿 呢 ? 是 
不 是 因为 编码 不 当心 导致 的 问题 ? 不 是 ,程序 实际 上 是 完全 按照 原来 的 设想 工作 的 , 它 在 到 达 文 
件 系 统 的 根 时 停 目 ,只 是 这 个 文件 系统 的 根 并 不 是 这 个 计算 机 上 整 标 文 件 树 的 根 。 

Unix 允许 将 一 个 磁 换 的 存 傅 组 织 成 一 棵 由 多 棵 树 相 互 连 接 的 树 。 每 个 磁盘 或 伐 盘 上 的 
每 个 分 区 都 包含 一 棵 目录 树 。 这 些 独 立 的 树 被 连接 成 一 棵 单一 的 几乎 无 甸 的 树 。 这 个 版 本 
的 pwd 恰好 碰 上 了 树 之 间 的 连接 地 带 。 


4.6 多 个 文件 系统 的 组 合 : 由 多 棵 树 构成 的 树 


一 个 Unix 系统 有 两 个 磁盘 或 分 区 将 会 如 何 ? 现在 已 经 知道 ,用 一 些 简 单 的 抽象 能 够 将 
一 个 单一 的 分 区 组 织 成 一 棵 目录 树 。 俱 是 如 果 有 两 个 分 区 ,需要 两 标 独 立 的 树 吗 ? 
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其 他 的 系统 又 是 如 何 做 的 呢 / 有 些 操作 系统 将 盘 符 或 着 标 分 配给 每 个 做 盘 或 分 区 ,并 
将 字母 或 名 字 作 为 一 个 文体 人 金 路 径 的 一 部 分 。 另 一 种 做 法 是 ,有 些 系 统统 一 给 所 有 的 磁盘 
分 配 世 的 编号 以 创建 一 个 虚拟 的 单一 磁 圾 。 

Unix 使 用 第 三 种 方法 .每 个 分 区 有 自己 的 文件 系统 树 。 当 计算 机 上 有 多 于 一 个 的 文件 
系统 时 ,Unix 提供 一 种 方法 将 这 些 树 整合 成 一 村 更 大 的 树 。 图 4. 13 表示 了 这 个 方法 。 


FAP Sine; — Hh O FEME: WAR 


ER 





图 4.13 树 的 嫁接 


B] 4. 13 中 用 户 看 到 的 是 一 棵 完好 的 目录 硅 , 但 是 实际 上 有 两 棵 树 , 一 个 在 磁盘 ] 上 ,一 
^TfrE m2 鞋 。 每 棵 树 都 有 一 个 要 目录 。 一 个 文件 系统 被 命名 为 根 文件 系统 ,这 棵 树 的 顶 疾 
BREA DEIR: 另 一 个 文件 系统 则 被 附加 到 根 文 件 系 统 的 某 个 子 目 录 上 。 在 内 部 ,内 
核 在 恨 文 件 系 统 将 一 个 目录 作为 嵌 针 ,指向 另 一 个 文件 系统 的 根 ,这 翌 两 个 文件 系统 就 联系 
EXT. 

4.6.1 装载 点 


在 Unix 中 ,装载 文件 系统 (to mount a file system) HERA AE AM KSEE 
某 些 支持 . 子 树 的 根 目 录 被 媒人 入 到 根 文件 系统 的 一 个 旭 录 中 . 子 树 所 在 的 目 录 被 称 做 第 二 个 
系统 的 装载 点 (moeunt point), 

命令 mount 列 出 当前 所 装载 的 文件 系统 以 及 它们 的 装载 点 ， 


$ mount 

/dev/hdal on / type exc2 (rw) 

/dev hda6 on /home type ext2 (rw) 

none on /proc type proc (rw) 

nene on 'dev/pts type devpts (rw, mode = 0620) 
5 


输出 的 第 一 行 表明 /dev/hda 上 的 分 区 1( 第 一 个 IDE 设备 ) 被 装 裁 在 树 的 根 目 录 上 。 这 
个 分 区 是 根 文件 系统 。 输 出 的 第 二 行 表明 dev/hda6 上 的 文件 系统 被 装载 在 根 文件 系统 的 / 
home 目录 上 。 内 此, 当 用 户 使 用 chdir 从 “/” 进 入 */home" 时 ,实际 上 是 从 一 个 文件 系统 进 
人 了 男 一 个 文件 系统 ， 当 该 pwd 沿 树 向 上 回溯 时 , 它 就 会 停 在 /home, 因 为 它 到 达 了 该 文件 
系统 的 顶端 . 
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Unix 人 允许 不 同类 型 的 文件 系统 被 装载 在 根 文 件 系 统 。 例 如 ,一 个 含有 ISO 9660 文件 系 
统 的 CD-ROM 能 够 被 装载 在 一 个 Unix 机 器 上 ,并 且 盘 上 的 目录 和 文件 将 会 成 为 树 的 一 部 
分 。 如 果 内 核 包 含 知道 如 何 与 Macintosh 文件 系统 协同 上 作 的 驱动 程序 ,那么 一 个 含有 
Macintosh 文件 系统 的 磁盘 就 能 够 被 装载 。 甚 至 ,通过 网 络 连 接 的 其 他 的 计算 机 上 的 文件 系 
统 也 能 够 被 装载 。 


4.6.2 多 重 i- 节 点 号 和 设备 交叉 链接 


将 不 同 的 文件 系统 合成 一 棵 树 有 很 多 优点 ,当然 也 有 小 问题 。 在 Unix 中 ,每 个 文件 都 
有 一 个 ji- 节点 号 ， 就 像 两 条 不 同 的 街道 都 有 一 个 门牌 号 为 402 的 房子 一 样 , 两 个 不 同 的 磁 
盘 可 能 都 含有 i- 节 点 号 为 402 的 文件 。 若 干 个 目录 可 能 都 含有 i- 节点 号 为 402 的 文件 ,内 
核 是 如 何 启 道 应 该 使 用 哪个 402 的 i- 节点 呢 ? 

仔细 观察 图 4. 14 中 被 圈 出 来 的 两 个 目录 ,一 个 在 根 文 件 系统 ,一 个 在 被 装载 的 文件 系 
统 。 每 个 目录 都 包 售 一 个 i- 节 点 402 的 链接 。myls.c My. old 似乎 为 指向 同 - -个 i~ 节 点 的 
FAR EMT i- TAERE? A 1 上 的 文件 系统 有 一 个 i- 节点 402 ,磁盘 2 上 的 文 
件 系 统 有 一 个 不 同 的 i- 节 点 402。 这 两 个 链接 根本 不 指 疝 同 一 个 文件 。 





图 4.14 -节点 号 和 文件 系统 


这 个 例子 列举 了 一 个 由 树 连 接 成 树 的 一 个 问题 , 即 一 个 i- 节点 号 并 不 惟一 地 标识 一 个 
文件 了 。 就 像 刚刚 看 到 的 那样 ,相同 的 i 一 节点 号 402 出 现在 两 个 不 同 的 自 录 中 , 却 指 向 2 个 
不 同 的 文件 。 看 起 来 这 两 个 链接 指向 同一 个 文件 ,但 实际 上 却 不 是 。 

如 何 从 不 同 的 文件 系统 生成 指向 同 个 文件 的 链接 ? 这 一 点 是 无 法 微 到 的 ,文件 以 数 
据 块 的 集合 和 一 个 i- 节点 的 形式 出 现在 磁盘 上 ,日 录 中 的 链接 会 指向 那个 i- 节点。 如果 一 
个 磁盘 上 的 链接 指向 另 一 个 磁盘 上 的 i- 节 点 将 会 发 生 什 么 事 ” 如 果 另 一 个 磁盘 未 被 装载 ， 
文件 则 会 不 存在 。 更 糟糕 的 是 ,如 果 一 个 存储 着 拥有 i 一 节 点 402 的 不 同文 件 的 不 同 磁盘 被 
装载 , 则 文件 的 内 容 就 完全 不 同 了 。 你 也 可 以 想到 其 他 麻烦 的 情况 。 

link 和 rename 系统 调用 知道 这 种 情况 吗 ? 知道 。link 拒绝 创建 跨越 设备 的 链接 ， 
rename 拒绝 在 不 同 的 文件 系统 间 进 行 i 节点 号 的 转移 。 阅 读 手册 可 以 了 解 它们 所 返回 的 
错误 代码 。 
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4.6.3 符号 链接 


硬 链接 (hard links) 是 将 目录 链接 到 笃 的 指针 , 硬 链接 同时 也 是 将 文件 名 和 文件 本 身 链 
接 起 来 的 指针 。 

硬 链 接 不 能 指向 其 他 系统 中 的 i 节 点 ,即使 根 也 不 能 生成 到 目录 的 链接 。 也 许 有 支持 
这 种 跨 系 统 链接 的 理由 ,但 Unix 支持 另 一 种 形式 的 链接 : 符号 链接 。 符 号 链接 通过 名 字 引 
用 文件 ,而 不 是 i- 节点 号 。 以 下 是 它们 的 比较 : 


S who > whoson 

$ ln whoson ulist 

5 ls -li whoson ulist 

377 -rw-r--r-- 2 bruce users 235 Jul 16 09;42 ulist 
377  -rw-r--r-- 2 bruce users 235 Jul 16 09:42 whoson 
$ ln ~ 5 whoson users 


5 ls ~ li whoson ulist users 


377  -rw-r-r-- 2 bruce users 235 Jul 16 09.42 ulist 
289 ]lrwxrwxrwx 1 bruce users $ Jul 16 09.43 users -> whoson 
377  -rw-r-r-- 2 bruce users 235 Jul 16 09:42 Whoson 


文件 whoson 和 ulist 是 指向 同 PICA. POS ARMA 18:377 ERG I FE Gr) 
文件 大 小 .修改 时 间 和 链接 数 。 通 过 命令 in 创建 硬 链接 list. 

另 一 方面 ,命令 n -s 生 成 文件 whoson 的 一 个 符号 链接 ,并 把 这 个 新 链接 称 为 users, 
Is -li 显示 users 拥有 i- 节点 289。 字 和 母 1 在 文件 类 型 点 处 融 明 users 是 一 个 符号 链接 。 链 
接 数 .修改 时 间 和 文件 大 小 都 不 同 于 原始 文件 。 文 件 users 并 不 是 原始 文件 whoson, {8 fi 4 
程序 对 它 进 行 读 写 时 , 它 就 像 原始 文件 一 样 。 例 如 : 


$ wc - 1 whoson users 
5 whoson 
5 users 
10 total 
$ diff whoson users 


$ 


命令 we 和 ditt 分 别 用 于 对 文件 计算 行 数 和 比较 内 容 。 在 这 种 情况 下 ,内 核 使 用 名 字 找 
到 原始 文件 。 另 一 方面 ,对 函数 stat 的 调用 返回 关于 链接 的 信息 , 而 不 是 关于 原始 文件 0 的。 

符号 链接 可 能 跨越 文件 系统 ,因为 它们 并 不 存储 原始 文件 的 i- 节点 。 符 号 链接 也 可 以 
指向 目录 ,因为 它们 与 将 文件 系统 联系 在 一 起 的 真正 的 链接 不 同 ， 

在 交 叉 设备 链接 的 情况 中 符号 链接 也 存在 前 面 所 讨论 的 问题 ,如 果 保 存 原始 文件 的 文 
件 系统 被 删除 了 ,或 者 原始 文件 有 了 新 的 文件 名 ,符号 链接 都 将 指向 空 。 恕 困 一 个 拥有 相同 








Q ”系统 调用 lstat 返回 链接 所 指 井 的 文件 的 信息 。 
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名 字 的 文件 被 吉 载 了 .符号 链接 则 将 指向 不 同 的 文件 ， 指 向 目录 的 符号 链接 可 以 指向 父 目 
录 . 因 此 在 有 目录 择 中 产生 循环 套 。 符 号 链接 可 以 将 你 的 文件 系统 彻底 滴 乱 ,但 是 内 核 知道 这 
些 仅 是 符号 链接 .而 不 是 直 正 的 链接 ,所 以 能 够 愉 查 丢失 的 引用 各 死 循环 . 

系统 调用 symlink 用 于 创建 一 个 符号 链接 。 系 统 调用 readlink 用 干 获取 原始 文件 的 名 
c, ba AFAR i d Ea A. ER LTE By OS LA unlink, link 和 符号 链接 是 如 
何 作用 的 。 


小 & 


]， 主 要 内 容 

* Unix 将 存储 在 磁盘 中 的 数据 组 织 威 文件 系统 。 文 件 系 统 是 文件 和 有 目录 的 集合 。 月 
录 是 名 宇和 指针 的 列表 。 目 录 中 的 入 -个 人 口 指向 一 个 文件 或 目录 。 目 录 包 含 指 向 
父 呈 录 和 和子 目录 的 人 口 。 

* Unix 文件 系统 包含 3 个 主要 部 分 : BRR I -PTRARAREKR. MHASH 
数据 块 。 文 件 属 性 存储 在 i- 节点 。 表 中 i- 节点 的 位 置 称 为 文件 的 iO RUE. nds 
点 号 是 文件 的 惟一 林 识 。 

， 相同 的 1~ 节 点 号 可 能 以 不 同 的 名 字 在 若干 个 目录 中 出 现 。 每 个 人 口 被 称 为 指向 文 
件 的 硬 链 接 。 符 屿 链接 是 通过 文件 名 引用 文件 .而 不 是 1- 节点 号 。 

. 若干 个 文件 系统 的 目录 树 可 被 整合 成 一 棵 树 。 内 核 将 一 个 文件 系统 的 目录 链接 到 另 

一 个 文件 系统 的 根 的 操作 称 为 装载 . . 

Unix 包含 若干 种 系统 调用 .允许 释 储 员 进 行 创 建 得 除 目录 .复制 指针 LR IET. 

改变 连接 和 分 离 其 他 文件 系统 等 的 操作 . 

2. Bb 
日 录入 日 是 文件 名 和 i- 节 点 导 组 成 的 对 。 i x S EIL ELSE EB s T. E ET 
含 文件 信息 和 数据 块 的 分 配 . 如 图 4. 15 所 示 。 





图 4.15 i- 节 点 .数据 块 .日 站 、 指 针 
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3, 下 一 章 的 内 容 

文件 只 是 一 种 类 型 的 数据 源 。 程 序 也 可 姓 理 来 自 于 像 终 端 ,数码 相机 ,扫描 仪 等 设备 的 
数据 。Unix 程序 如 何 从 设备 读 取 数据 和 发 送 数据 呢 ? 

4， 习 题 


4,1 


4,2 


4.4 


4. 5 


4.6 


pwd 显示 京 件 系 统 中 到 达 当 前 目录 的 路 径 。 从 某 种 意义 上 说 ,那个 上 日 录 是 在 树 中 
所 处 的 位 置 . 实际 上 该 目录 是 一 些 字 节 的 集合 ,而 这 个 集合 存 依 在 磁盘 上 的 某 个 
位 置 ,该 位 置 能 以 柱 面 .磁头 . 扇 区 和 字 节 的 方式 定位 。 有 办 法 将 当前 工作 有 呈 录 转 
Te nx e ge ror ER 


看 -- 下 所 使 用 的 系统 中 的 一 个 厂 盘 。 找 出 它 有 多 少 个 分 区 Le SET AEH ON 
点 的 个 数 和 数据 块 的 个 数 。 


Unix 不 仅仅 是 在 内 部 使 用 将 磁盘 抽象 成 序列 的 方法 创建 文件 系统 ,而 且 它 使 得 这 
个 抽象 方法 适用 于 任何 拥有 合法 权限 的 用 户 。 要 伐 这 个 实验 ,需要 有 最 高 权限 ， 
即 管理 员 权 限 。 

/dev 目录 包含 允许 你 从 磁盘 块 中 读 取 字 节 的 设备 描述 文件 ,从 设备 读数 据 的 时 候 
可 以 认为 数据 就 在 这 些 文件 中 。 在 一 个 装 有 IDE 设备 的 Linux 系统 上 ,可 以 看 到 
PRR dev/hda, /dev/hdb,dev/hdc,/dev/bdd Bj X fF. 这些 设 备 文件 不 是 像 /etcy 
passwd 或 /var/adm/utmp 这 样 的 常规 数据 文件 。 这 些 数据 文件 提供 对 磁盘 上 原 
始 数据 的 访问 ,而 且 可 以 重用 cat, more, cp 和 其 他 的 命令 来 读 取 磁盘 上 的 内 容 。 
SUR SC ump 一 样 ,磁盘 有 一 个 清晰 的 结构 。 一 块 接 一 块 地 查看 磁盘 内 容 的 一 
种 方法 是 使 用 命令 od -c/dev/hda | more。 当 查看 该 命令 的 输出 时 ,就 会 觉得 磁 
盘 是 一 个 顺序 的 .连续 的 磁盘 杞 一样。 每 个 分 区 都 由 其 中 的 一 个 特定 文件 表示 。 


例如 ,/dev/hda 上 的 第 一 个 分 区 被 称 为 /dev/hdal， 


查看 系统 中 的 /dev 目录 , 找 册 对 应 于 系统 上 硬盘 驱动 .软盘 驱动 .CD-ROM 驱动 
QUESTO EX Sh RE a 


本 章 中 担 到 内 核 在 新 建 一 个 文件 时 需要 找到 一 个 空 的 i- WARM SR. A 
核 如 何 知道 哪些 磁盘 块 是 空 的 ? 哪些 i 节点 是 空 的 ? 你 机 器 上 的 文件 系统 使 用 
什么 方法 跟踪 那些 未 被 使 用 的 磁盘 块 和 ii 节点 呢 ? 


Unix 能 够 读 取 和 装载 包含 非 Unix 文件 系统 的 磁盘 , 像 PC-DOS 和 Macintosh f£ 
盘 。 在 内 部 ,这 些 系 统 没 有 i- 节 点 。 虽 然 如 此 , 当 使 用 命令 mount 将 其 中 一 个 磁 
BEE Unix 系统 时 ,命令 ls -i 将 会 列 出 i- 节点 。 

查看 Linux 源 代 码 以 确定 这 些 编号 从 何 处 来 。Linux 为 何 添加 它们 ? 


本 章 中 通过 描述 包含 10 个 直接 块 .1 PR 个 二 级 间接 块 和 1 个 三 级 间接 块 

的 i~ 贡 点 解释 了 分 配 列 表 。 有 些 Unix 版 本 使 用 不 同 的 编号 。 

CL) 你 所 使 用 的 系统 上 的 一 节点 分 配 列 表 的 格式 是 怎样 的 ? 头 文件 应 该 包含 这 
些 详细 内 容 。 
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(2) 你 系统 上 的 一 个 数据 块 的 大 小 是 多 少 ? 

(3) 在 你 的 系统 上 ,不 使 用 间接 氧 的 最 大 文件 是 什么 ? 

CD 在 你 的 系统 上 ,不 使 用 二 级 间接 块 的 最 大 文件 是 什么 ? 最 大 的 文件 实际 上 用 
了 多 少 个 块 ? 


一 个 文件 可 能 有 多 个 链接 。 链接 计 数 器 记录 了 文件 的 链接 个 数 。 那 么 目录 如 何 
We? 在 你 自己 的 demodir RE EAA ls -1 找 出 每 个 目录 的 链接 数 。 将 这 些 链 接 数 
和 图 表 上 的 第 头 相 比 较 。 解 释 月 录 链 接 数 的 意思 。 为 什么 每 个 目录 的 链接 数 至 
少 为 2? 


没有 人 能 够 使 用 iink 生成 到 目录 的 新 链接 。 在 过 去 ,超级 用 户 有 权 生 成 到 目录 的 
硬 链接 。 在 demodir 的 例子 中 , 疯 测 在 用 户 视图 和 系统 视图 中 添加 系统 调用 link 
("demodir/c", "demodir/d2/e PG Bt P^ ^E BS S IR. SUE E Ed ls -iaR 
demodir 1& ^ ^E fF AAR. 


24 [f£ FB mount 命令 将 一 个 文件 系统 装载 到 另 一 个 文件 系统 ,装载 点 必须 是 原 有 文 
件 系 统 的 一 个 目录 。 考 虑 将 /devyhda4 上 的 文件 系统 连接 到 /home2 这 个 目录 上 
的 情况 ;思考 以 下 两 个 问题 (1) 如 果 /home2 这 个 装载 点 不 存在 将 产生 什么 结果 ? 
(2) 如 果 装 载 点 存在 ,和 且 包含 文件 和 子 目 录 , 将 产生 什么 结果 ? 


命令 rmdir 不 删除 含有 文件 或 子 目 录 的 目录 。 为 什么 要 这 人 么 做 ? 

另 一 方面 ,可 以 删除 含有 用 户 的 目录 。 SRO PME: 生成 一 个 由 自己 命名 的 
新 目录 并 进 人 这 个 目录 ,然后 开启 另 一 个 傅 令 窗口 ,删除 这 个 新 目录 。 关 闭 第 二 
个 命令 窗口 ,输入 命令 /bin/ pwd, 看 看 将 产生 什么 。 


硬盘 上 的 柱 面 Ccylinder) 是 什么 意思 ? 硬盘 的 物理 构造 是 什么 使 得 柱 面 这 个 概念 
对 有 效 利用 磁盘 如 此 重要 ? 在 网 上 查找 柱 面 组 (cylinder group) 这 个 概念 。 解 释 
这 个 概念 和 本 章 中 文件 系统 模型 之 间 的 联系 。 


很 多 人 都 了 解 磁盘 空间 不 足 这 个 概念 。 一 个 Unix 文件 系统 有 一 个 1- 节 点 区 域 
和 一 个 数据 区 域 。 因 此 ,即使 数据 区 有 空间 ,i- 节 点 空间 也 有 可 能 不 足 。 当 在 
Unix 上 上 安装 了 一 个 新 的 磁盘 ,需要 将 磁盘 分 成 ji 一 节点 表 和 数据 区 。 文 件 系统 上 
的 每 个 文件 都 需要 一 个 i- 节 点 。i- 节 点 表 越 大 , 留 给 文件 内 容 的 空间 越 小 。 
假设 要 安装 一 个 新 的 硬盘 。 命 令 mkfs 生成 一 个 新 的 文件 系统 并 县 让 你 确定 i- 
节点 表 的 大 小 。 阅 读 联 机 帮助 以 了 解 这 个 命令 。 为 什么 需要 大 量 的 i~ 节 点? 为 
什么 有 时 候 又 比 常 规 需要 的 少 ? 





系统 调用 stat 接受 文件 名 和 指向 结构 的 指针 ,并 且 将 文件 信息 填充 到 该 结构 中 。 
解释 stat 是 如 何 通 过 使 用 目录 、i -节点 和 数据 模型 米 完成 该 功能 的 、 它 是 从 哪 
里 找到 数据 并 将 数据 复制 到 stat 结构 中 的 呢 ? 
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5.. 编程 练习 


HP 


. 14 


4,15 


4,16 


编写 一 个 创建 整个 demodir Hoe BEES Unix fp. 
Unix 命令 mkdir 接受 选项 -p。 编 写 一 种 支持 这 个 选项 的 mkdir 命令 版 本 。 


命令 mv 不 仅仅 调用 系统 调用 rename。 编 写 … 种 接受 两 个 参数 的 mv 版 本 。 第 
一 个 参数 必须 是 文件 名 ,第 二 个 参数 是 文件 名 或 目录 和 名。 如 果 目 标 是 个 目录 名 ， 
则 mv 将 文件 移动 到 那个 目录 。 否 则 ,如 果 可 能 的 话 ,mv 将 重 命名 这 个 文件 。 


本 章 中 提供 了 一 种 使 用 link 和 unlink 编写 的 rename 版 本 。 该 代码 片断 检验 
link 的 返回 值 , 但 是 并 未 检验 unlink 的 返回 值 。 扩 充 该 段 代 码 ,使 得 它 能 够 正确 
处 理 unlink 的 错误 信息 。 


阅读 联机 帮助 和 涉 广 件 以 了 解 系统 上 的 超级 块 的 结构 。 编 写 一 个 能 够 打开 文件 
系统 ,阅读 超级 块 和 以 清晰 可 读 的 格式 显示 文件 系统 设置 的 程序 。 这 个 练习 与 
ian utmp 记录 内 容 和 stat 结构 的 程序 类 似 。 


对 新 建 一 个 文件 的 解释 列 出 了 4 个 主要 的 操作 。4 个 操作 必须 完全 正确 才能 使 
文件 能 够 被 正确 添加 到 文件 系统 。 如 果 计 算 机 在 这 一 系列 的 操作 中 突然 掉 电 将 
会 发 生 什 么 情况 ?例如 ,如 果 数 据 被 存储 在 了 数据 区 ,而 i- 节点 还 未 被 分 配 , 将 
发 生 什 么 事 ? 

CD 为 这 4 个 操作 选择 一 种 顺序 ,并 加 以 解释 。 

(2) 现在 假设 一 个 系统 按照 (1) 的 答案 被 创建 ,如 果 系 统 在 这 个 这 程 中 突然 崩溃 
将 怎么 办 ? 例如 ,你 的 过 程 有 4 个 步骤 .3 个 中 间 点 ,在 每 个 点 的 崩 渡 将 会 导 
致 文件 系统 的 哪些 不 -- 致 性 呢 ? 

(3) 阅读 Unix 命令 fsck。 看 看 (2) 的 答案 和 fsck 寻找 的 内 容 有 多 少 是 接近 的 。 


在 第 3 章 中 编写 了 ls -1 的 一 个 版 本 。 修 改 那个 程序 ,使 得 它 不 仅 能 够 显示 原先 
的 信息 ,还 能 显示 i- 节 点 号 。 另 外 ,你 的 新 版 本 的 Is 是 从 哪里 找到 i- 节点 号 的 ? 








6. 项 目 


find cu、1s —R,mount,dump 











概念 与 技巧 

， 文 件 和 设备 间 的 相似 之 处 
， 文 件 和 设备 癌 的 不 同 之 处 
* 连接 的 属性 

。 竞争 和 原子 操作 

， 控制 设备 驱动 程序 

* Ji 

相关 的 系统 调用 

* fentl ioctl 

* tcsetattr,tcgetattr 

相关 命令 

* stty 


* write 


5.1 为 设备 编程 


前 看 章节 中 已 经 讲述 了 -一些 与 文件 和 目录 相关 的 程序 。 计 算 机 还 有 其 他 的 数据 来 源 ， 
如 调制 解 调 器 、 打 印 机 、 扫 描 仪 . 熏 标 , 扬 声 器 、 照 相机 和 终端 等 这 样 的 外 部 设备 。 在 本 章 中 
将 学 习 这 些 设备 与 昌 录 和 文件 的 相似 之 处 和 不 同 之 处 ,并 了 解 如 何 将 这 些 想法 用 于 管理 设 
f B) HE HE. 

本 章 的 项 只 是 编写 命令 stty 的 另外 一 个 版 本 。stty 用 来 让 用 户 检 测 、 修 改 控制 键盘 和 
mai REN Re, 





5.2 设备 就 像 文件 


很 多 人 认为 文件 是 ~- 些 存 储 在 磁盘 上 的 数据 ,但 是 Unix 采用 一 种 更 抽象 的 方法 。 首先 
考虑 文件 的 实际 情形 : 文件 包含 数据 ,具有 属性 ,通过 目录 中 的 名 字 被 标识 。 可 以 从 一 个 文 
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件 读 取 数 据 , 也 可 以 向 一 个 文件 写 人 数据 。 现 在 请 注意 ,这 种 方法 将 被 应 用 于 设备 。 

考虑 一 块 连接 到 麦 上 克 民 和 扬 南 器 的 声卡 。 你 对 着 麦克 风 说 话 , 声 卡 将 来 自 你 声音 的 信 
号 转换 成 数据 流 , 使 得 程序 能 够 读 取 这 个 数据 流 。 当 程序 向 声卡 写 人 数据 流 时 ,声音 就 从 声 
声 器 中 出 来 。 对 一 个 程序 来 说 ,声卡 既是 数据 的 渡 , 又 是 数据 的 且 的 地 .。 

一 个 带 有 键盘 和 显示 器 的 终端 也 和 文件 燃 似 。 键 盘 输 人 就 像 数 据 一 样 能 够 被 程序 读 
取 ,而 一 个 进程 把 写 人 终端 的 字符 显示 在 屏幕 上 。 

Xf Unix 来 说 ;声卡 .终端 .鼠标 和 磁盘 文件 是 间 一 种 对 象 。 在 Unix 系统 中 ,每 个 设备 都 
被 当做 一 个 文件 。 每 个 设备 都 月 -- 个 文件 名 .一 个 i- 节 点 号 、 一 个 文件 所 有 者 一 个 权限 位 
的 集合 和 最 近 修 改 时 间 。 你 所 了 解 的 和 文件 有 关 的 所 有 内 容 者 将 被 运用 于 终端 和 其 他 的 
设备 。 
5.2.1 设备 具有 文件 名 


每 个 加 载 到 Unix 机 器 的 设备 (终端 .打印 机 .和 鼠标、 磁盘 等 ) 都 通过 文件 名 表示 。 通 常 ， 
表示 设备 的 文件 存放 在 目录 /dev 中 ,但 是 可 以 在 任何 目录 中 创建 设备 文件 。 请 查看 不 局 
Unix 机 器 上 的 dev 目录 。 以 下 是 我 所 使 用 的 机 器 上 的 部 分 列表 ， 





$ ls - C /dev | head -5 


XOR fdlu720 loop! ptygt Sda7 stderr ttysd . 
agpgart fdlu800 ipd ptyrd sdaB stdin ttyse 
apm bios  fdlu820 ipl ptyrl sda9 stdout ttysf 
ared tdJu830 lp2 ptyr2 sdb tape ttyto 
dsp flash0 mcd ptyr3 sdbi tcp ttyti 


这 个 列表 显示 了 若干 种 设备 。 第 三 列 中 的 Ip 文件 是 打印 机 。 第 二 列 中 的 fq* 文件 是 
软驱 。sd * 文件 是 SCSI 设备 的 分 区 ,/dev/tape 是 磁带 备份 驱动 程序 的 设备 文件 。 最 后 一 
列 中 的 tty* 文件 是 终端 .程序 通过 读 取 这 些 文件 获得 用 户 的 键盘 输入 ,通过 写 人 这 些 文件 
向 终端 屏幕 发 送 数据 。 

dsp 文件 是 到 声卡 的 一 个 连接 。 进 程 通过 向 该 设备 文件 写 人 字 节 来 运行 一 个 声音 文件 。 
进程 可 以 通过 打开 文件 /dev/mouse 来 读 取 鼠标 的 单 击 和 位 置 的 变化 。 


5.2.2 设备 和 系统 调用 
设备 不 仅 具 有 文件 名 ,而 且 支 持 与 所 有 文件 相关 的 系统 调用 ， cpen .read、write ,lseek、 


close 和 stat, 


例如 ,从 磁带 污 取 数据 的 代码 如 下 : 

int fd; 

fd = open ("/dev/tape",O RDONLY) ， /* connect to tape drive «/ 
lseek (fd, (long)4096, SEEK SET); /* fast forward 4096 bytesx/ 
n = read (fd, buf, buflen); /* read data from tape */ 


close (fd); /* disconnect */ 
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和 磁盘 文件 相关 的 系统 调用 同样 可 以 为 其 他 设备 服务 。 实 际 上 ,Unix 没有 其 他 的 方法 
用 来 和 设备 通信 。 

当 你 移动 鼠标 并 按键 ,鼠标 将 数据 发 送 到 系统 ,使 得 进程 能 够 读 取 它 们 。 向 设备 写 人 数 
据 意味 着 什么 呢 ? 发 送 数 据 到 鼠标 ,不 会 使 鼠标 移动 ,也 不 会 使 鼠标 的 键 被 按 下 。 
/dev/mouse 文 件 不 支持 所 有 的 write 系统 调用 。 当 然 ; 可 以 制造 带 有 发 动机 的 刀 标 ,然后 编 
写 一 个 更 高 级 的 鼠标 驱动 程序 ,使 得 系统 能 够 接受 并 产生 鼠标 事件 ， 

终端 支持 read 和 write. (AA x HF lseek。 考 起 一 下 这 是 为 什么 呢 ? 


5.2.3 例子 : 终端 就 像 文件 


Unix 的 很 多 用 户 输入 来 自 终端 。ttysd ,ttyse 等 文件 都 代表 终端 。 按 传统 定义 终端 是 键 
盘 和 显示 单元 ,但 实际 可 能 包括 一 个 20 世纪 ?0 年 代 生 产 的 打印 机 ,一 个 键盘 和 一 个 串 行 接 
口 的 显示 器 ,或 是 一 个 调制 解 调 器 和 通过 拨号 上 网 的 软件 。 在 因特网 登录 的 telnet 或 ssh f 
口 也 可 以 认为 是 一 个 终端 。 终 端 最 重要 的 功能 是 接受 来 自用 户 的 字符 输入 和 将 输出 信息 显 
示 给 用 户 。 显示 输出 单元 甚至 可 以 产生 育 文 打印 或 声音 。 

命令 tty 用 来 告知 用 户 所 在 终端 的 文件 名 。 用 终端 文件 做 以 下 试验 : 





$ tty 
/dev/pts/2 
$8 cp /etc/motd /dev/pts/2 
Today is Monday, we are running low on disk space. Please delete files. 
- your sysadmin 
$ who > /dev/pts/2 
bruce  pts/2 Jul 17 23;35 (ice,northpole. org) 
bruce  pts/3 Jul 18 02;03 (snow. northpole. org) 
$ ls — li /dev/pta/2 
4 crw--w--w- 1 bruce tty 136, 2 Jul 18 03:25 /dev/pts/2 


从 以 上 输出 可 以 知道 ,终端 tty 对 应 的 设备 描述 文件 名 为 /dev/pts/2。 可 以 对 该 文件 使 
用 任何 与 文件 相关 的 命令 和 进行 任何 文件 操作 ,如 cp, EAE“ >” mv, In rm cat 或 ls 等 
Abe. 

命令 cp JA BOR XX fF /etc/motd 中 读 取 数据 ,向 设备 文件 /dev/pts/2 写 人 数据 ,使 得 内 
容 能 够 显示 在 屏幕 上 。 写 人 设备 文件 就 是 向 设备 写 人 字 节 ,例子 中 的 下 一 行 表明 将 带 有 
HE “>” 9 who 的 输出 内 容 发 送 到 /dev/pts/2, 并 将 数据 以 字符 的 形式 显示 在 屏 
EM, 


5.2.4 设备 文件 的 属性 
设备 文件 具有 磁盘 文件 的 大 部 分 属性 。 上面 ls 的 输出 内 容 表 明 / dev/pts/2 拥有 i- 节 点 
4 权限 位 为 rw--w--w- ;1 个 链接 ,文件 所 有 者 bruce 和 组 tty, JR XE Ke PE A [8] Jul 18 at 


中 这 有 点 像 让 人 用 的 点 字 法 。 
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03 ;25。 文 件 类 型 是 *c”, 表 示 这 个 文件 实际 上 是 以 字符 为 单位 进行 传送 的 设备 。 权 限 位 看 起 
来 有 点 奇怪 ,表达 式 136,2 显示 在 表示 文件 大 小 的 地 方 , 它 有 什么 特殊 的 含义 呢 ? 

(OD 设备 义 忻 和 文件 太 小 

常用 的 磁盘 文件 由 字 节 组 成 ,磁盘 文件 中 的 字 节 数 就 是 文件 的 大 小 。 设 备 文件 是 链接 ， 
而 厅 是 容器 。 键 盘 和 鼠标 不 存 铺 击 键 数 和 点 击 数 。 设 备 文件 的 i- 节 点 存 鱼 的 是 指 疝 内 核子 
程序 的 指针 ,而 不 是 文件 的 大 小 和 存储 列表 。 内 核 中 传输 设备 数据 的 子 程序 被 称 为 设备 驱 
HE. 

f£ / dev/pts/2 这 个 例子 中 ,从 终端 进行 数据 传输 的 代码 是 在 设备 一 进程 表 中 编号 为 136 
的 子 程序 。 该 子 程 序 接受 一 个 整 型 参数 。 在 /devyptsy2 中 ,参数 是 2。136 和 2 这 两 个 数 被 
称 为 设备 的 主 设备 号 和 从 设备 号 。 主 设备 号 确定 处 理 该 设备 实际 的 子 程序 ,而 从 设备 号 被 
， 作 为 参数 传输 到 该 子 程序 。 

(2) 设备 文件 和 权限 位 

每 个 文件 都 有 相应 的 读 、 写 和 执行 的 权限 。 当 文件 实际 上 表示 设备 时 ,权限 位 表示 什么 
意思 呢 ? 向 文件 写 人 数据 就 是 把 数据 发 送 到 设备 ,因此 ,权限 写意 味 着 允许 向 设备 发 送 数 
据 。 在 这 个 例子 中 ,文件 所 有 者 和 组 uy 的 成 员 拥 有 写 设备 的 权限 ,但 是 只 有 文件 的 所 有 者 
有 读 取 设备 的 权限 。 读 取 设 备 文件 就 像 读 取 普通 文件 一 - 样 , 从 文件 获得 数据 。 如 果 除 了 文 
件 所 有 者 还 有 上 其 他 用 户 能 够 读 肥 /dev/pts/2， 那么 其 他 人 也 能 够 读 取 在 该 键盘 上 输入 的 字 
符 , 污 取 其 他 人 的 终端 输入 会 引起 某 些 麻烦 ， 

另 一 方面 , 阿 其 他 人 的 终端 写 人 字符 是 Unix 中 write 命令 的 目标 。 


5.2.5 编写 write 程序 


在 即时 消息 各 聊天 室 出 现 之 前 , Unix 用 户 通 过 使 用 命令 write 和 在 其 他 终端 上 的 用 户 
HX. 


$ man 1 write 
WRITE(1) Linux Programmer's Mannual WRITE(CI) 
Name 
write 一 send a message to another user 
SYNOPSIS 
write user [ttyname ] 
DESCRIPTION 
Write allows you to communicate with other users by copying lines from you terminai to 
theirs. 
When you run the write command, the user you are writing to gets a message nf the form; 


Message from yourname(Z yourhost on yourtty at hh ;mm 


Any further lines you enter will be copied to the specified user's terminal. If the nther user 
wants to reply, they must run write as well. 
When you are done, type an end - of — file or interrupt character. The other user will see the 


message EOF indicating that the conversation is over. 
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以 下 这 个 简单 的 write 版 本 仅 发 送 消息 内 容 , 而 不 发 送 ^*Message from... ”这 些 提示 信 
息 , 并 且 需 要 的 参数 是 终端 的 文件 各 (ttyname) ,而 不 是 其 他 人 的 用 户 名 : 


/* writed.c 
* 
x purpose; send messages to another terminal 
* method; open the other terminal for output then 
* copy from stdin to that terminal 
* shows: a terminal is just a file supporting regular i/o 
* usage; writed tryname 
wf 
Hinclude < stdio. h> 
# include «Z fentl. h> 
main( int ac, char « av |} 
{ 
iut fd; 
char buf[ BUFSIZ]; 
/* check args */ 
if (Cac !- 2){ 
fprintf(stderr, "usage; write0 ttynameXn") ; 
exit(1); 
} 
/* open devices »/ 
fd = open( av[1], O WRONLY 5; 
if { fd == -171 
perror(av[1]); exit(1); 
} 
/* loop until EOF on input */ 
while( fgets(buf, BUFSIZ, stdin} |= NULL) 
if ( write(fd, buf, strlen(buf)) == -1>} 
break, 
close( fd): 
i 
仔细 阅读 这 段 代码 ,在 这 里 找 不 到 键盘 连接 到 其 他 用 户 屏幕 所 需 的 特殊 特征 。 这 个 简 
单 的 write 程序 将 一 个 文件 的 内 容 一 行 行 地 复制 到 另 一 个 文件 。 这 个 例 程 和 前 面 章节 中 的 
例子 表明 终端 就 像 其 他 连接 到 Unix 机 器 的 设备 一 样 ,能 够 以 磁盘 文件 的 方式 镀 处 理 。 


5.2.6 设备 文件 和 i- 节 点 


这 些 设备 文件 是 如 何 工作 的 呢 ? Unix 文 代 系统 的 1- 节点 和 数据 块 是 如 何 支持 设备 文 
件 这 个 概念 的 ? 图 5. 1 显示 了 它们 之 间 的 关系 。 

目录 是 文件 名 和 证 点 导 的 列表 。 目 好 并 不 能 区 分 哪些 文件 名 代表 谤 盘 文 件 ,哪些 文 
件 名 代表 设备 。 文 件 类 型 的 区 别 体现 在 i 一 节点 上 。 
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的 列表 


45.1 指向 数据 块 或 驱动 器 的 5 节点 


每 个 i- 节 点 编号 指向 1 节点 表 中 的 一 个 结构 。i- 节 点 可 以 是 磁盘 文件 的 ,也 可 以 是 设 
备 文 件 的 。i- 节 点 的 类 型 被 记录 在 结构 stat 的 成 员 变量 st_mode 的 类 型 区 域 中 。 

磁盘 文件 的 1- 节点 包含 指向 数据 兢 的 指针 。 设 备 文 件 的 1- 节 点 包含 指向 内 核子 程序 
表 的 指针 。 主 设备 号 用 于 告知 从 设备 读 取 数据 的 那 部 分 代码 的 位 园 。 

考虑 一 下 read 是 如 何 工作 的 。 内 核 首先 找到 文件 描述 符 的 ;~ 节点 ,该 -节点 用 于 告诉 
内 核 文件 的 类 更。 如 果 文 件 是 俩 盘 文 件 . 那 么 内 核 通过 访问 块 分 配 天 来 读 取 数据 ， 如果 文 
件 是 设备 文件 ,那么 内 核 通 过 鸿 用 该 没 备 驱 沸 程序 的 read 部 分 来 迹 取 数据 。 其 他 的 操作 , 例 
如 open, write, lseek 和 close 等 都 是 类 似 的 。 


5.3. 设 省 与 文件 的 不 同 之 处 
收盘 文件 和 设备 文件 都 有 文件 名 和 属性 ,从 表面 上 看 很 类 似 。 系 统 调用 open 用 干 创建 


与 文件 和 设备 的 连接 。 但 是 与 磁盘 文件 的 连接 不 同 于 与 终端 的 连接 。 图 5.2 显示 了 带 有 两 
个 文件 描述 符 的 进 各 ,一 个 是 到 磁盘 文件 的 连接 , 另 一 个 是 到 终端 用 户 的 连接 。 
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图 5.2 拥有 两 个 文件 描述 的 进程 
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现在 已 经 了 解 了 一 些 关于 连接 的 内 部 情况 。 与 磁盘 文件 的 连接 通常 包含 内 核 缓 冲 区 。 
从 进程 到 磁盘 的 字 节 先 被 缓冲 ,然后 才 从 内 核 的 缓冲 区 被 发 送出 去 。 磁 盘 连 接 具 有 缓冲 这 
样 一 个 属性 。 到 终端 的 连接 则 不 同 ,进程 需要 尽快 把 到 终端 的 数据 传送 出 去 。 

与 终端 或 调制 解 调 器 的 连接 也 具有 属 人 性。 连接 拥有 波 特 率 .奇偶 位 .暂停 位 的 个 数 。 一 
般 情 况 下 所 输入 的 字符 都 会 显示 在 屏幕 上 ,但 是 有 些 时 候 . 例 如 当 输 人 密 但 时 .字符 并 不 回 
显 在 屏幕 上 。 回 显 字 符 不 是 键盘 任务 的 一 部 分 ,也 不 是 程序 应 该 做 的 ; 回 显 是 连接 的 一 个 属 
性 ,到 磁盘 文件 的 连接 没有 这 些 属 性 。 


EZRA AB h 
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|, 连接 可 有 哪些 属性 ? 

2， 如 何 检 测 当 前 的 属性 ? 

3. 如 何 改变 当前 的 属性 ? 

下 面 介绍 两 例 : 盛 盘 连接 的 属性 和 终 疹 连接 的 属性 ， 


5.4 磁盘 连接 的 属性 
系统 凋 用 open 用 于 在 进程 和 人 厂 盘 文件 之 间 创 建 一 个 连接 。 该 连续 含有 若干 个 属 手 ,下 
面 先 仔细 学 习 其 中 的 两 个 属性 .然后 再 了 解 一 下 其 他 的 属性 ， 
5.4.1 iiti: Bip 


图 5. 3 显示 了 当 两 个 管道 通过 一 个 进程 单元 连接 时 文件 描述 符 的 情况 。 那 个 进程 单元 
是 用 来 进行 级 冲 和 完成 其 他 进程 任务 的 。 在 请 有 能 内 的 是 寿 制 变 基 ,用 以 决定 文件 找 述 符 应 
该 采取 哪个 进程 步骤 。 








设置 文件 描述 符 控 
制 驱 动 器 如 何 运作 





5,3 数据 波 中 的 进程 单元 


可 以 通过 修改 控制 变量 改变 文件 描述 符 的 动作 。 例 如 ,通过 简单 的 3 SR EB a UR 
冲 , 如 图 5.4 所 示 。 
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改变 驱动 器 设置 : 
1. 获 取 设 置 
2.08 git E 

3. 存 储 设 置 
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图 5.4 ”修改 文件 描述 符 的 运作 


首先 ,生成 一 个 系统 调用 将 控制 变量 从 文件 描述 符 复 制 到 进程 。 然 后 ;修改 这 个 复制 过 
来 的 控制 变量 。 最 后 ,将 修改 过 的 值 送 回 内 核 . 新 的 没 置 被 安帝 在 进程 代码 中 :内 核 恨 据 新 
的 设置 处 理 数 据 。 下面 是 遵循 上 述 3 步 的 代码 ， 


眷 include <fentl.b> 


int s; //settings 

s = Font) (fd, F_GETFL); ‘get flags 

s | = O_SYNC; //set SYRC bit 

result = fcntl (fd, F SETFL, s); //set Flags 

af (C result == 1) //if error 
perror (“setting SYNC"); //report 


X PETS YR ST MERRE EPP. IR BEUS HI fend 通过 读 号 该 整数 位 来 控制 
文件 描述 符 ， 


fcntl 








目标 控制 文件 描述 符 
LUE # include <fentl, h> 
# include <unistd, h> 
# include <sys/types. h> 




















gi d mu int resalt = fenilint fd, int emi 

int result = fentlCint fd, int cmd, long arg); 

int result = fentl(int fd, int emd, struct flock * lockp); 
参数 id 需 控 制 的 文件 描述 符 


cmd ” 需 进 行 的 操作 
arg ”操作 的 参数 
lock “ 锁 信 息 
返回 值 = ih Bl BR 
other 依 操 作 而 定 





fone] 在 fd 所 指定 的 文件 上 执行 操作 cmd, arg 代表 操作 cmd 所 使 用 的 一 个 参数 。 在 上 
例 中 ,参数 F_GETFL 得 到 当前 的 位 集 ( 也 就 是 flags)。 变 量 3 存放 这 个 flag 集 ， 位 逻辑 或 
操作 打开 位 O. SYNC, 该 位 告诉 内 核 ,对 write 的 调用 仅 能 在 数据 写 人 实际 的 硬件 时 才能 返 
回 ,而 不 是 在 数据 复制 到 内 核 缓冲 时 就 执行 贞 认 的 返回 操作 。 





» 132 = Unix, Linux 编程 实践 教程 
最 后 ,把 修改 过 的 设置 返回 内 核 。 将 F_SETFT. 操作 作为 第 二 个 参数 ,将 修改 过 的 设置 
作为 第 三 个 参数 ， 这 3 个 步骤 (从 内 核 中 读 取 设置 到 变量 ,修改 这 些 设置 ,将 设置 返回 内 被) 
是 Unix 中 读 取 和 修改 连接 属性 的 典型 方法 。 
设置 O_SYNC 会 关闭 内 核 的 缓冲 机 制 ,如 果 没 有 很 充分 的 理由 ， 最 好 不 要 关闭 缓冲 。 


5.4.2 属性 2:; 自动 添加 模式 


文件 描述 符 的 另 一 个 属性 是 自动 添加 模式 (auro- append mode), 自动 添加 模式 对 于 若 
干 个 进程 在 同一 时 间 写 人 文件 是 很 有 有 几 的 。 

为 什么 自动 添加 是 有 用 的 ? 

考虑 日 志文 件 wtmp。wtmp 存储 所 有 的 登录 各 退出 记录 。 当 一 个 用 户 登 录 时 ,程序 
login 在 wimp 的 末尾 追加 一 条 登录 记录 。 当 一 个 用 户 退出 时 ,系统 在 wimp 的 本 尾 追加 一 
条 退出 的 记录 ,如 同系 统 维护 的 日 记 一 样 。 这 就 像 人 们 写 日 记 一 样 , 每 篇 都 被 添加 在 末尾 。 

不 能 使 用 Iseek 在 末尾 进行 添加 记录 吗 ? 考虑 一 下 登录 的 远 辑 ,如 图 5.5 Bran. 
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lseek (fd,0,SEEK END); = 
write (fd,&rec, len); = 





图 5.5 FA Iseck 和 write 3E fT EE hn 


Iseck 将 当前 位 置 移 到 文件 的 末尾 ,然后 添加 登录 的 记录 。 这 里 会 产生 什么 错误 呢 ? 
如 果 两 个 人 同时 登录 将 会 发 生 什么 ? 含有 时间 过 程 .如 图 5.6 所 示 。 


时 间 A 用 户 B 登录 
FARA 登录 3 

L. lseek [£4,0, SEEK, END) ; 

2. lseekifd,0, SEEK it 

4 : write(fi,&rec,len!; 

A? writelfd,Lrec, E: 


图 5.6 Iseek 和 write fr 5l 8928 AL 


wimp 文件 显示 在 中 辐 ,时 间 简 头 在 左 壹 :并 显示 了 4 个 时 间 片 断 。 用 户 A 登录 的 代码 
显示 在 左边 ,用 户 B 登录 的 代码 显示 在 右边 。 到 现在 为 止 一 切 都 正常 吗 ? 一 个 重要 的 事实 
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是 ,Unix 昆 一 个 时 间 共 享 系统 ,这 个 过 程 需要 两 个 独立 的 步骤 : lseek 和 write, 

现在 仔细 看 看 下 面 ， 

- BIBT -BB 的 登录 进程 定位 文件 的 未 尾 

- 时间 2 一 BB 的 时 间 片 用 完 ,A 的 登录 进程 定位 文件 的 末尾 

。 时 间 3 一 A 的 时 间 片 用 完 ,B 的 登录 进程 写 人 记录 

。 时 间 4 一 B 的 时 间 片 用 完 ,A 的 登录 进程 写 人 记录 

因此 ,A 的 登录 进程 写 人 的 记录 覆盖 了 B 的 记录 ,B 的 登录 记录 丢失 。 

这 种 情况 被 称 为 竞争 (race condition)。 这 两 个 进程 所 共享 的 网 状 效应 依赖 于 这 两 个 进 
程 如 何 规划 。 在 时 间 方 面 做 一 个 小 的 改动 ,可 能 A 的 登录 记录 会 丢失 ,可 能 两 个 都 不 会 
BR, | 
如 何 避 免 这 种 竞争 ” 有 很 多 方法 避免 竞争 。 竞 争 是 系统 编程 所 面临 的 重要 问题 ,后 面 
需要 多 次 回 到 这 个 话题 。 在 这 个 特定 的 情况 中 ,内 核 提供 一 个 简单 的 解决 办 法 : 自动 添加 模 
式 ， 当 文件 描述 符 的 O_APPEND 位 被 开启 后 ,每 个 对 write 的 调用 自动 调用 lseek HAA 
添加 到 文件 的 末尾 ， 

下 面 的 代码 启动 自动 添加 模式 ,然后 调用 write: 


# include <(fcntl. h> 





int 3; // settings 
s = fentl ( fd, F_GETFL); //get flags 
s |= O APPEND; //set APPEND bit 
result = fentl ( fd, F_SETFL, sì); //set flags 
if (result == -1) //if error 
perror ( "setting APPEND"}; // report 
else 
write (fd, &rec, 1); //write record at end 


术语 竞争 和 原子 操作 (atomoc operation) Vf HX. Xf Iseek 和 write 的 调用 是 独立 的 
系统 调用 ,内 核 可 以 随时 打 断 进程 ,从 而 使 后 面 这 两 个 操作 被 中 新。 当 D_APPEND 被 置 位 ， 
内 核 将 lseek 和 write 组 合成 一 个 原子 操作 ,被 连接 成 一 个 不 可 分 割 的 单元 。 


5.4.3 用 open 控制 文件 描述 符 


O SYNC 和 O_APPEND 是 文件 描述 符 的 两 个 属性 ,其 他 的 性 性 将 在 后 面 的 章节 中 讨 
iE. fentl 的 联机 帮助 列 出 了 你 的 系统 上 所 支持 的 所 有 选项 和 操作 ，。 

fcntl 并 不 是 仅 有 的 胃 来 设置 文件 描述 符 属 性 的 方法 。 通 常 在 打开 一 个 文件 时 ,应 该 知 
道 需 要 怎样 的 设置 。 可 以 通过 系统 调用 open 的 第 二 个 参数 的 一 部 分 来 设置 文件 描述 符 的 属 
HEB. BI ,调用 : 


fd = open ( WIMP_FILE, O WRONLY | O APPEND | O _SYNC) ; 


以 写 方式 打开 文件 wtmp 并 将 OQ_APPEND 和 OLSYNC 位 开启 。open 的 第 二 个 参数 不 
只 是 读 、 写 或 读 / 写 的 选择 。 
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例如 ,可 以 通过 open 创建 一 个 包含 O_CREAT 标志 位 的 文件 。 以 下 两 个 润 用 是 等 
价 的 : 


fd = creat ( filename, permission bits); 
fd = open ( filename, O CREAT | O_TRUNC : 0 WRONLY, permission bits); 


为 什么 open 可 以 实现 相同 的 功能 ,i crear HKIBTE YE? 在 老 的 版 本 中 ,open 仅仅 用 来 打 
开 文 件 ,creat 用 来 创建 新 的 文件 。 随 后 .open 被 多 次 修改 以 支持 更 多 的 标志 位 ,包括 创建 文 
件 选 项 。 

open 支持 的 其 他 标志 位 : 


O CREAT 如 果 不 存 在 ;创建 该 文件 。 可 查看 O EXCL, 
O TRUNC 如果 文 件 存在 ,将 文件 长 度 舞 为 6. 
0_EXCL 0_EXCL 标志 位 防止 两 个 进程 创建 间 样 的 文件 。 如 果 文 件 存 在 且 0_EXCL 被 置 位 . 则 返回 一 1。 


O_CREAT 和 O EXCL 的 组 合用 来 消除 以 下 竞争 情况 : 如 果 两 个 进程 同时 创建 相同 的 文 
件 将 会 发 生 什么 情况 ? 例如 ,如 果 两 个 进程 都 要 写 wimp, 但 是 这 个 文件 不 存在 时 ,都 要 创建 该 
文件 ,此 时 会 发 生 什 么 情况 ? 程序 能 够 先 调用 set 查看 文件 是 否 存 在 ,如 果 不 存 在 ,就 调用 
creat。 当 stat 和 creat [B] 3E ER TT EU] Io] LX HEEL JP. O EXCL/O CREAT 的 组 合 将 这 两 
个 洞 用 构成 了 一 个 原子 操作 。 虽 然 想 法 很 好 ,但 是 这 种 方法 在 荣 些 重 要 场合 并 不 可 行 。 一 个 可 
靠 的 替代 方案 是 使 用 link。 本 章 的 练习 提供 了 一 个 例子 。 


5.4.4 磁盘 连接 小 结 


内 尽 在 梯 志 和 进程 间 传 输 数 据 。 内 核 中 进行 这 些 传输 的 代码 有 很 多 选项 。 程 序 可 使 用 
open 和 feat 系统 调用 控制 这 些 数据 传输 的 内 部 运作 ,如 图 5.7 所 示 ， 
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5.5 终端 连接 的 属性 
系统 调用 open 在 进程 和 终端 之 间 创 建 一 个 连接 。 现 在 来 仔细 了 解 一 下 与 终端 连接 的 一 
Hm rt. 
5.5.1 终端 的 1/O 并 不 如 此 简单 


终端 和 进程 之 间 的 连接 夏 起 米 简 单 。 通 过 使 用 getehar 和 putchar 就 能 够 在 设备 和 进程 
介 传 给 字 节 。 数 据 流 的 这 种 抽 银 使 得 键盘 和 屏幕 看 起 来 就 像 在 进程 中 一 样 ,如 图 5. 8 Bom. 





图 5.8 一 个 简章 ,直接 连接 的 流程 


一 个 简单 的 实验 表明 这 个 模型 并 不 完整 . 考虑 以 下 这 个 程序 ， 


/* listchars.c 
* purpose: list individually all the chars seen on input 
* output: char and ascii code, one pair per line 
* input: stdin, until the letter 0 
* notes; usesful to show that buffering/editing exists 
x/ 
# include <stdio.h> 
nain() 
{ 
inte, n = Q; 
while( ( c = getchar()) 1= ‘Q' ) 
printf("char &3d is &c code sAn”, ntt, c, c): 
} 


这 个 程序 以 一 个 接 一 个 的 方 武 处理 字符 , 谈 取 字符 ,打印 数值 .字符 本 身 以 及 它 的 内 部 
代码 。 编 译 并 运行 这 个 程序 ,结果 如 下 所 示 ， 


S ./listchars 








- 186 4 Unix/Linux 40 £e Sc P Fe 








bello 

char 6 is h code 104 
char ) is e code 101 
char 2 is 1 code 108 
char 3 is 1 code 108 
char 4 is o cade 111 
char 5 is 

code 10 

Q 

$ 


接 下 来 会 发 生 什 么 事情 ? 如 果 字 符 代码 直接 从 键盘 流向 gerchar,' 则 在 每 个 字符 后 可 看 
到 一 个 响应 。 和 输 人 单词 hello 中 的 5 个 字符 并 按 回 车 键 。 然 而 仅 在 这 个 时 候 , 程 序 才 开始 处 
理 这 些 字符 。 输入 看 起 来 被 缓冲 了 。 就 像 流向 磁盘 的 数据 ,从 终端 流出 的 数据 在 沿途 中 的 
某 个 地 方 被 存储 起 来 了 。 

listchars 显示 了 另外 一 些 内 容 。Enier ÆR Return 键 通常 发 送 ASCI E 13, 即 回 车 符 。 
lisrchars 的 输出 显示 ASCH 13 被 换行 符 ( 代 码 10) 所 替代 。 

第 三 种 处 理 影响 程序 的 输出 。listchars 在 每 个 字符 申 的 末尾 添加 一 个 换行 符 (n)。 揪 
行 符 代 码 告诉 鼠标 移 到 下 一 行 ,但 没有 告诉 它 移 到 起 左边 。 代 个 :13( 回 车 符 ) 告 诉 鼠 标 回 到 
RAR, 

运行 jistebars 表明 在 文件 描述 符 的 中 间 必 定 有 一 个 处 理 层 。 国 5.9 显示 了 该 层 的 部 分 
作用 。 











FUF AIR n fE 
是 显示 器 接收 到 
\ Al ‘vn’, 
Rips A CN. 
BERTIE 


^n. 













图 5.9 内 核 处 理 终端 数据 


这 个 例子 说 明了 3 种 处 理 : 

]. TEER PRA Return 后 才 接 收 数据 : 

2， 进 程 将 用 户 输 人 的 Return(ASCIIT BÀ 13) 看 作 换 行 符 (ASCIl 10); 
3， 进 程 发送 换行 符 ,终端 接收 回 车 换行 符 。 
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与 终端 的 连 楼 包含 一 套 完整 的 属性 和 处 理 步 缀 ， 
5.5.2 和 终端 驱动 程序 
终端 种 进程 之 间 的 连接 如 图 5. 10 所 示 。 








(8 5.10 终端 驱动 器 是 内 篇 的 一 部 分 


处 理 进程 和 外 部 设备 间 数 据 流 的 内 核子 程序 的 集合 被 称 为 终端 驱动 程序 或 tty CERE 
序 由 。 驱 动 程序 包含 很 多 控制 设备 操作 的 设置 。 进 程 可 以 读 、 修 改 和 重 置 这 些 驱动 控制 
标志 。 


5.5.3 sty 命令 


stty 命令 让 由 户 读 取 和 修改 终端 驱动 程序 的 设置 。 
(D 使 用 suy 显示 驱动 程序 设置 
sity 的 输出 如 下 所 示 : 


5 stty 

speed 9600 baud; line = 0; 

$ stty - all ; 

speed 9600 baud; rows 15; columns 80; line = 0; 

intr = ^C; quit = ^V; erase = ^7; kill = ^U; eof = +D; eol = <undef>; 
eol2 = <Cundef>; start = >Q; stop = ^S; susp = ^2, rprnt = ^R; werese = ^W; 
lnext = ^U; flush = ^O; min = 1; time = 0; 

— parenb ~ parodd csB — hupcl ~ cstopb cread ~ clocal -crtscts 

- igübrk brkint ignpar - parmrk - inpck istrip - inlcr - igner icrnl ixon — ixoff 
— iwcle 一 ixany imaxbel 

opost —- olcuc -ocru onler - onocr ~ onlret — of3l1 - ofdel n10 cr0 tabO hsO vtO FFO 


isig icanon iexten echo echoe echok - echonl - noflsh ~ xcase —- tostop - echoprt 





Q wy 是 指 由 Teletype 4 à] A 0) 35351 ED ERR, 
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echoct] echoke 


默认 选项 的 列表 很 简洁 。 旭 加 上 选项 -all 则 将 列 出 更 多 的 设置 。 有 些 设 置 是 有 值 的 变 
景 ,有 些 是 布尔 值 。 例 如 , 波 特 率 和 屏幕 的 行 数 与 列 数 拥有 数值 。 像 intr、quit 和 eof REM 
拥有 字符 值 。 而 像 icrnl、 一 olcuc 和 onler 的 值 是 开 或 关 。 

这 些 意味 着 什么 ? icrnl 是 Input;convert Carriage Return to NewLine( 输 入 时 将 回 车 转 
换 为 换行 ) 的 缩写 , 即 在 前 面 的 例子 中 虹 动 程序 所 做 的 操作 。 缩 写 onler 代表 Output:add to 
NewLine a Carriage Return( 输 出 时 在 新 的 一 行 中 加 人 人 回 车 )。 一 个 属性 前 的 减 号 表 拓 这 个 
操作 被 关闭 。 例 如 , -oleuc 表示 动作 Output:convert LowerCase to UppcrCase( 输 出 时 将 小 
写字 母 转换 成 大 写 } 被 禁止 。 很 多 早期 的 终端 只 显示 大 写 宁 母 ,所 以 那 时 将 输出 转换 成 大 写 
RAH. 

(2) 使 用 stty 改变 驱动 程序 设置 、 

这 里 是 -- 些 使 用 stty 修改 驱动 程序 属性 的 例 于 : 








$ stty erase X 和 make 'X* the erase key 
$ stty - echo H type invisibly 
$ stty erase ( echo + multiple requests 


在 第 一 个 例子 中 ,使 用 stty SIR, RAR NRE E TL . 
任何 键 作 为 删除 键 吕 。 在 第 二 个 例子 中 ,关闭 按键 回 旺 。 当 输入 密码 时 ,字符 并 不 回 显 在 屏 
幕 上 。 关 闭 这 个 加 显 意味 着 能 够 打字 ,但 是 着 不 到 所 输 人 的 字符 。 在 第 三 个 例子 中 ,使 用 
stty 一 次 性 改变 多 种 设置 。 同 时 将 删除 键 改 为 人 @ ,并 将 回 显 模式 开局 。 

stty 如 何 运 作 ? 现在 能 够 编写 stty 了 吗 ? 


5.5.4 编写 终端 驱动 程序 : 关于 设置 


tty 驱动 程序 包含 很 多 对 传人 的 数据 所 进行 的 操作 。 这 些 操作 被 分 为 4 种， 

， 输 入 : 驱动 程序 如 何 处 理 从 终端 来 的 字符 

输出: 驱动 程序 如 何 处 理 流向 终端 的 字符 

， 控 制 : 字符 如 何 被 表示 一 -位 的 个 数 、 位 的 奇偶 作 ,停止 位 等 

。 林地: 驱动 程序 如 何 处 理 来 自 张 动 程序 内 部 的 字符 | 

输入 处 理 包括 将 小 写字 母 转换 为 大 写字 母 , 去 除 最 高 位 及 将 回 车 符 转换 为 换行 符 。 输 
出 处 理 包括 用 若干 个 空格 符 代 蔡 制 表 符 ,将 换行 符 转换 为 回 车 符 及 将 小 写字 母 转 换 为 大 写 
字母 。 控 制 设置 包括 奇偶 性 及 停止 位 的 个 数 。 本 地 处 理 包括 同 显 字符 给 用 户 及 缓冲 输入 直 
到 用 户 按 回 车 键 。 

除了 开 和 关 设 置 外 ,驱动 程序 维护 了 一 张 含 有 特殊 意义 键 的 列表 。 例 如 ,用 户 可 能 按 退 
HREM UR TNE RE. POD ALAR ATEHERE. Dei on LACER 
还 负责 对 其 他 一 些 控制 字符 进行 处 理 。 

联机 帮助 上 列 出 了 stty ABST Bt APS SE TT. 








WS} Unix shell 处 型 此 命令 AE 82 AL ELS PR FE BORN OE ,而 不 在 驱动 程序 中 处 理 此 命令 ， 
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5.5.5 编写 终端 驱动 程序 : 关于 函数 


改变 终端 驱动 程序 的 设置 就 像 改 变 磁盘 文件 连接 的 设置 一 畔 : 
(OD 从 驱动 程序 获得 属性 ; 

(2) 修改 所 要 修改 的 属性 ; 

(3) 将 修改 过 的 属性 送 回 驱 动 程序 。 

例如 ,以 下 代码 为 一 个 连接 开启 字符 回 显 ， 


£ include <termios, h> 


struct termios attribs; /* struct to hold attributes */ 
tcgetattr ( fd, &settings); f+ get attribs From driver #/ 
settings.c lflag | = ECHO; '* turn on ECHO bit in flagset »/ 


tcsetattr ( fd, TCSANOW, &settings); /* send attribs back to driver *»/ 


通常 的 过 程 在 图 5. 11 中 进行 描述 。 


t include —termios.ho 
struct termios settings; 
tcgetattr(fd,&sottíngs); 


/* test, set. or 
clear bits x/ 


tesetattr(fd. how, &sertings); 





FA 5.11 WA tegetater 和 tesetatir $82 08 £5 38) OR 27] BE 


HE e €. tegetatir 和 tcsetattr HE tx] 2€ MAIR al SE AY Ufo]. SET RAE termios 结构 中 
交换 设置 。 以 下 是 详细 描述 。 











4 tegetattr 

目标 读 取 ity 驱动 程序 的 属性 
头 文件 È include <termios, h> 

E include < inistd, h> 
e m m au int result = tcgetattr(int fd. struct termios * info); 
参数 id 与 终端 相 联 的 文件 描述 符 

info UIDES SPY YS E 
返回 值 -i LR 


0 成 功 返 回 
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tegetattr 从 与 文件 fd 相关 的 终端 驱动 程序 中 获取 当前 设置 ,并 把 它 复制 到 info 指针 所 





























指 的 结构 中 。 
tesetattr 
目的 O RR tty 驱动 埋 序 的 属性 
Atf # include «termios, h> 
l FH inelude Zunistd h> — | 
通 数 床 型 | int result = tcsetattrCint fd, int when, struct termios # info); 
参数 fd 与 终端 相 联 的 文件 描述 符 
when 改变 设置 的 时 间 
info 指向 终端 结构 的 指针 
返回 值 一 1 通 到 错误 


9 成 功 返 加 


tesetattr 从 info 所 指 的 结构 中 将 驱动 程序 的 设置 复制 到 与 文件 fd 相关 的 终端 驱动 程序 
ip. when 参数 告诉 tesetattr 在 什么 时 候 更 新 驱动 程序 设置 。when 的 允许 值 如 下 所 示 。 

(1) TCSANOW 

立即 更 新 驱动 程序 设置 。 

(2) TCSADRAIN 

等 待 直到 驱动 程序 队列 中 的 所 有 输出 都 被 传送 到 终端 。 然 后 进行 驱动 程序 的 更 新 。 

(3) TCSAFLUSH 

等 待 直到 驱动 程序 队列 中 的 所 有 输出 都 被 传送 出 去 。 然 后 ,释放 所 有 队列 中 的 输 人 数 
据 , 并 进行 一 定 的 变化 。 


5,5,6 编写 终端 驱动 程序 : 关于 位 
termios 结构 类 型 包括 若 于 个 标志 集 和 一 个 控制 字符 的 数组 。 所 有 的 Unix 版 本 包含 以 


struct termios 


{ 


tcflag_t c iflag; /* input mode flags «/ 
tcflag t c oflag; /* output mode flags x/ 
tcflag t c cflag; /* control mode flags */ 
tcflag t c lflag; /* local mode flags */ 
cc t c cc[ NECS]; jx control characters x/ 


speed t c ispeed; or input speed x/ 
speed t c ospeed; /* output speed x/ 
E 


MAR SIUE FE E E 89 38 3n uit BS REX TE ATE c. ispeed 和 c ospeed 成 员 中 。 
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dg E BUR [ERU A X ER 5.12 所 示 。 


c iflag 


c oflag 


c chag 


c ltlag 


首先 描述 的 4 个 成 员 是 标志 集 。 每 个 标志 集 包 含 在 该 组 中 的 操作 位 。 例 如 ,成 员 c iflag 
HE INLCR 值 的 位 。 成 员 c_cilag 设置 掩 码 PARODD 的 值 ,其 功能 是 设置 奇偶 性 。 所 有 这 
Eo gef dps X YE termios. h 中 。 如 从 驱动 程序 中 读 取 当前 的 属性 到 termios 结构 中 时 ,这 个 
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结构 中 的 所 有 值 都 可 以 被 检验 和 修改 ， 


成 员 c cc 是 控制 字符 的 数组 。 含 有 特殊 功能 的 键 都 被 存储 在 这 个 数组 中 。 数 组 中 的 每 
个 位 置 都 由 termios. h 中 的 常量 所 定义 。 例 如 ,attribs, c cc[ VERASE] = ‘\b' yp Moe 


序 将 退 格 键 作 为 删除 键 , 


现在 已 经 知道 如 何 从 驱动 程序 获得 设置 和 如 何 将 设置 存 回 驱 动 程序 ,下 面 看 看 修改 驱 


动 程序 属性 的 技术 . 


每 个 属性 在 标志 集中 都 占有 一 位 。 访 性 的 掩 码 定义 在 termios. h 中 。 要 测试 一 个 属性 ， 
需要 将 标志 和 集 与 那个 位 的 掩 码 柑 与 。 要 启动 这 个 属性 ,将 该 位 开启 。 要 禁止 这 个 属性 ,将 该 


位 关闭 。 上 面 的 情况 如 下 所 示 ，: 


- 141 。 
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操作 代 码 

测试 位 if C flagset & MASK)... 
a iu flagset | = MASK 

清除 位 ALD flagset & = ~MASK 


5.5.7 编写 终端 驱动 程序 : 几 个 程序 例子 


l. #-F: echostate. c 一 一 显示 回 显 位 的 状态 
第 一 个 例子 说 明 终端 是 否 被 设置 成 回 显 字符 的 模式 。 读 取 度 置 ,测试 位 ,并 报告 结果 : 


/* echostate.c 
* reports current state of echo bit in tty driver for fd 0 
* shows how to read attributes from driver and test a bit 
af 

#4 include <stdio.h> 

# inelude — «—termios. h> 

main() - 

1 

struct termios info; 


int rv; 


rv = tegetattr( 0, &info 2; /* read values from driver ¥/ 
if (rv == -1}{ 

perror( "tcgetattr"); 

exit(1); 


1 
$ 


if ( info.c_lflag & ECHO ) 

printf(" echo is on , since its bit is 1\n"); 
else 

printf(" echo is OFF, since its bit is 0\n"); 


} 


这 个 程序 为 文件 找 述 符 0 读 取 终端 属性 。0 LER HEM A AY EHR OER TE 
常 附属 在 键盘 上 。 这 里 是 编译 和 和 运行 程序 的 一 个 例子 : 


$ cc echostate.c - o echostate 
$ ./echostate 

echo is on, since its bit is 1 
$ stty - echo 

$ ./echostatr: not found 


$ echo is OFF, since its bit is 0 


这 个 例子 显示 命令 stty -echo 关闭 驱动 器 里 的 击 键 回 显 。 用 户 在 这 之 后 输入 了 另外 两 
个 命令 ,但 它们 在 屏幕 上 并 不 显示 。 另 一 方面 ,对 那 两 行 的 输出 响应 仍然 显示 。 
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2， 例 子 ; setecho.c 改变 回 显 位 的 状态 
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第 一 个 例子 将 键盘 回 量 开 或 关 。 如 果 命令 行 参数 以 *y" 开 始 ,终端 的 回 显 标志 被 开启 。 


否则 回 显 被 关闭 . 程序 如 下 所 示 : 


/* setecho.c 
* usage: setecho [ yj n] 


* shows; how to read, change, reset tty attributes 


xf 
# include — <stdio.h> 
Finclude << termios. h= 


# define oops(s,x) | perror(s); exit(x); ! 


main(int ac, char x av[ D) 


i 


struct termios info; 


if (ac == 1) 
exit(0):; 
if ( tegetattr(0,&info) == -1) /* get attribs x/ 


oops("tcgettattr", 1); 


if (av|1]10? == ty) 

info.c lflag | = ECHO ; /* turn on bit «/ 
else 

info.c lflag &- --ECHO ; /* turn off bit «/ 
if ( tcsetattr(0,TCSANOW,&info) == 1) /* set attribs «/ 


cops("tcsetattr",2); 
} 


测试 并 运行 这 两 个 程序 以 及 正常 模式 下 的 stty: 


$ echostate; setecho n ; echostate ; stty echo 
echo is on, since its bit is 1 

echo is OFF, since its bit is 0 

$ stty - echo; echostate ; setecho y ; setecho n 
echo is OFF, since its bit is Q 


在 第 一 个 命令 行使 用 setecho 关闭 回 旺 ， 然 后 使 用 sty 将 回 显 重新 开启 。 驱 动 程序 和 
驱动 程序 设 星 被 存储 在 内 核 ,而 不 起 在 进程 。 一 个 进程 可 以 改变 驱动 程序 里 的 设置 , 另 一 个 


不 同 的 进程 可 以 读 取 或 修改 设置 。 
3. 例子: showtty.c 显示 大 量 驱 动 程序 属 性 





可 以 重复 用 setecho. c 和 echostate. c 中 的 技术 建立 一 个 完整 的 stty 版 本 。tty 驱动 程序 
BA 3 种 设置 : PREAH .数值 和 位 。showtty 包含 显示 这 些 数据 类 型 的 函数 。 以 下 是 代码 ， 


/* showtty.c 
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* displays some current tty settings 


ui 


# include <stdio.h> 


# include «< termios. b> 


maint) 
{ 
struct termios ttyinfo; /* this struct holds tty info »/ 
if ( tegetattr( 0 , &ttyinfo ) == -1)1 /* get info x/ 
perror( "cannot get params about stdin"); 
exit(1); 
} 
/* show info */ 
showbaud ( cfgetospeed( &ttyinfo ) ); /* get + show baud rate */ 


printf ("The erase character is ascii *d, Ctrl- &cVWn", 
ttyinfo.c cc[VERASE], ttyinfo.c ce[ VERASE] -1+ 'A*); 
printf("The line kill character is ascii $d, Ctrl- %c\n", 
ttyinfo.c_ce[ VKILL], ttyinfo.c cc[VKILL]- 1 * 'A*»; 
show some flags( &ttyinfo ) ， /* show misc. flags x/ 
f 
showbaud( int thespeed } 
/* 
* prints the speed in english 
x/ 
{ 
printf¢ "the baud rate is "); 
switch ( thespeed }{ 
case B300; printf£("300\n"); break; 
case B600; printf("600\n"); break; 
case B1200; printf("1200Xn'). break; 
case B1800: printf("1800\n"); break; 
case B2400; printf("2400\n"); break; 
case B4800. printf("4800in") ; break; 
case B9600: printf("9600\n") ; break; 
default: printf("Fastin'") ; break; 


} 


struct flaginfo { int fl value; char x fl name; |; 


struct flaginfo input flags[] = | 
IGNBRK , "Ignore break condition", 
BRKINT "Signal interrupt on break", 
IGNPFAR "Ignore chars with parity errors", 


PARMRK "Mark parity errors”, 
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"Enable input parity check", 

ISTRIP , “Strip character", 

INLCR , “Map NL to CR on input", 

IGNCR , “Ignore CR", 

ICRHNL , "Map CR to NL on input", 

IXON , "Enable start/stop output control", 

f* 1XANY, “enable any char to restart output", «/ 
IXOFF , "Enable start/stop input control", 

0 NULL ); 


f 


struct flaginfo local flags| | = { 


ISIG , "Enable signals", 
ICANON , "Canonical input (erase and kill)", 
/* _XCASE , “Canonical upper/lower appearance", x/ 


ECHO , "Enable echo", 

ECHOE , "Echo ERASE as BS - SPACE — BS", 
ECHOK , "Echo KILL by starting new line", 
0 NULL } ; 


+ 


show some flags( struct termios * ttyp ) 

ix 
* show the values of two of the flag sets ; c iflag and c lflag 
* adding c oflag and c cflag is pretty routine - just add new 
* tables above and a bit more code below. 


xf 


show flagset( ttyp —-c iflag, input flags ); 
show flagset( ttyp —-c lflag, local flags }; 
} 
show flagset( int thevalue, struct flaginfo thebitnames[ ! ) 
pe 
* check each bit pattern and display descriptive title 
kd 
i 
int i; 
for (i7 0; khebitnames| i].fl value ; i++ ){ 
printf( " & s is ", thebitnames[ i].fi, name); 
if ( thevalue & thebitnanes[ i].fl value ) 
printf("ONNn") > 
else 


printf("OFFXn"):; 
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showtty FR it RAE S16 个 属性 的 当前 状态 ,并 附 有 注释 。 程 序 使 用 了 结构 表 
以 简化 代码 。 一 个 简单 的 函数 show_flagset 接收 一 个 整数 和 了 驱动 程序 标志 和 集 。 如 在 这 个 程 
序 中 增加 其 他 的 标志 和 集 需要 些 什么 呢 ? 将 这 个 程序 转换 成 完整 版 本 的 stty 需要 些 什 么 呢 ? 


5.5.8 终端 连接 小 结 


终端 是 大 们 用 来 和 Unix 进程 进行 道 信和 的 设备 。 终 端 拥 有 一 个 可 以 让 进程 读 取 字符 的 
键盘 和 是 让 进程 发 送 字符 的 显示 器 。 终 端 是 一 个 设备 ,所 以 它 在 目录 树 中 表现 为 一 个 特殊 
的 文件 ,通常 在 ;dev 这 个 目录 中 。 

进程 和 终端 间 的 数据 传输 和 数据 处 理 出 终端 驱动 程序 负 真 ,终端 驱动 程序 是 内 核 的 一 
部 分 。 该 内 核 代 码 提供 缓冲 .编辑 和 数据 转换 。 程 序 可 通过 调用 tcgetattr 和 tesetattr 查看 
和 修改 该 驱动 程序 的 设置 ， 


5.6 其 他 设备 编程 : ioctl 


到 磁盘 文件 的 连接 有 一 个 属性 集 , 到 终端 的 连接 有 另外 一 个 属性 集 。 到 其 他 类 型 设备 
的 连接 是 怎样 的 呢 ? 

考虑 CD 刻录 机 。 可 擦 写 的 CD 能 够 被 删除 内 容 , 能 以 不 同 的 速度 刻录 CD. BERA 
自己 的 设置 ,如 解析 度 和 颜色 深度 等 。 其 他 类 型 的 设备 有 各 自 的 属性 集 。 程序 员 如 何 查 看 
和 控制 一 个 设备 的 设置 呢 ? 

iT EIS GUAE BE CER DEVE ioctl: 
































ioctl 

目标 控制 一 个 设备 
头 文件 才 jnelude < sys/ioctl. ho 
函数 原型 int result = ioctl (int fd, int operation L. arg... |; 
参数 fd 与 设备 相 联 的 文件 描述 符 

operation ” 需 进 行 的 操作 

atg... Bn Sq Em 
1 [2] f 一 1 AUS 


other IK EC iE 


系统 调用 ioctl 提供 对 连接 到 fd B) r$ SK FERT BUE PER ER EH. ERRASSE BS E 
备 都 有 自己 的 属性 集 和 ioctl 操作 和 集 。 

例如 ,一 个 终端 屏幕 ,有 一 个 以 行 和 列 或 者 是 以 像素 为 单位 的 大 小 属性 。 TERE T 
示 屏 幕 的 尺寸。 


H include  «Zsys/ioctl. hz» 
void print screen dimensionst) 
i 


struct winsize wbuf; 
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if ( ioctl ( 0, TIOCGWINSZ, &wbuf) |= -1){ 
printf ("&d rows x &d cois\n", wbuf.ws row, wbuf.ws col); 


printf ("d wide x &d tallin", wbuf.ws xpixel, wbuf.ws ypixel?; 
\ 


符号 TIOCGWINSZ 是 函数 代码 ,wbuf 的 地 址 是 该 设备 控制 函数 的 参数 。 

阅读 头 文 件 是 了 解 设 备 美 型 以 及 相关 函数 的 好 方法 。 联 机 帮助 中 有 关 设 备 的 内 容 也 包 
括 属 性 和 函数 的 列表 。 例 如 ,Linux 中 有 美 stt4) 的 联机 帮助 讲述 了 使 用 ioctl 控制 SCSI ff 
带 驱动 器 的 细节 。 


5.7 文件 .设备 和 流 


任何 数据 的 源 或 日 的 地 都 被 Unix 视 为 文件 。 基 本 的 系统 调用 既 适 用 于 磁盘 文件 也 同 
样 适 用 于 设备 文件 ,它们 的 区 别传 现在 对 连接 的 把 作 上 。 磁 盘 文 件 的 文件 描述 符 包 含 对 组 
冲 属 性 和 扩展 属性 的 定义 代码 。 终 端的 文件 描述 符 包 含 编辑 . 回 显 .字符 转换 和 其 他 操作 的 
属性 定义 代码 。 

可 以 把 每 个 处 理 步 又 描述 成 连接 的 一 个 属性 ,但 是 反 过 来 说 ,连接 也 可 以 看 作 是 处 理 步 
又 的 组 合 。20 世纪 80 年 代 由 AT& T JE AES — T Unix 版 本 System V 建立 了 一 个 以 处 理 序 
列 为 基础 的 数据 流 模 型 。 这 有 点 像 清 洗 汽 车 。 首先 ,将 肥皂 水 酒 在 车 上 。 然 后 用 大 咕 子 氛 
去 艾 尘 。 下 一 步 , 用 高 压 软 管 将 表面 的 肥皂 泡 染 和 灰尘 清除 ,同时 使 用 车 盘 锈 抑制 剂 ,打上 
热 晴 ,为 轮轴 盖 镀 馈 。 最 后 用 软 布 和 热 空 气 弄 干 表 面 。 

当然 ,每 个 步骤 都 是 汽车 清洗 者 从 汽车 清洗 公司 买 来 部 件 完成 的 。 买 来 之 后 把 它们 安 
置 在 清洗 序列 中 的 某 个 位 置 ,整个 系统 就 可 以 工作 了 。 而 且 ,可 以 进行 重组 和 改造 ,比如 省 
略 某 些 特定 的 步 又 (注意 请 不 要 用 热 蜡 1)。 

这 是 数据 流 模型 和 连接 属性 的 流 模 型 的 一 个 大 概 的 想法 。 流 模型 的 一 个 重要 特征 是 处 
理 的 模块 化 。 如 果 不 满意 仅 能 支持 像 大 小 写 转 搞 这 样 的 终端 驱动 程序 ,可 以 设计 并 安装 一 
个 可 将 数字 转换 成 罗马 数字 的 模块 。 也 就 是 ,可 以 编写 一 个 能 完成 从 阿拉 伯 数 字 到 罗马 数 
字 转 换 的 处 理 模块 。 将 它 写 到 流 模 型 规范 ,然后 使 用 特殊 的 系统 调用 将 该 模块 安装 到 系统 
上 。 流 数据 经 过 它 的 处 理 就 从 阿拉 伯 数 字 变 成 罗马 数字 了 。 

在 联机 帮助 上 查看 streamio 以 了 解 更 多 关于 通过 这 种 方式 管理 连接 属性 问题 的 解决 方 
案 。 在 某 些 版 本 的 Unix 中 , 流 用 来 实现 网 络 服务 。 


小 2 


1， 主 要 内 容 

。 内 核 在 进程 和 外 部 世界 朵 交换 数据 。 外 部 世界 包括 名 盘 文件 .终端 和 外 部 设备 (和 像 打 
印 机 .磁带 驱动 器 .声卡 和 鼠标 )。 到 磁盘 文件 和 终端 的 连接 有 相似 之 处 但 也 有 差异 。 

© 磁盘 文件 和 设备 文件 都 有 和 名字 、 属 性 和 权限 位 。 标 淮 文件 系统 沽 用 open. read, 
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write .close 和 [seek 可 被 用 于 任何 文件 或 设备 。 文件 权限 位 以 同样 的 方式 应 用 于 控 
制 设 备 文件 和 磁 癌 文件 的 访问 。 
到 磁盘 文件 的 连接 在 处 理 和 传输 数据 方面 不 同 隆 到 没 备 文 件 的 连接 。 内 核 中 管理 与 
设备 连接 的 代码 被 称 为 设备 驱动 程序 。 通 过 使 用 {cntl 和 ioctl ,进程 可 以 读 取 和 改变 
设备 驱动 程序 的 设置 。 

。 到 终端 的 过 接 是 如 此 的 重要 ,以 至 函数 tcgecattr 和 tesetattr 专门 用 来 提供 对 终端 驱 

动 器 的 控制 。 

。 Unix 命令 stty 使 得 用 户 能 够 访问 regerar 和 tcsetatir 函数 ， 

2. 图 示 

进程 使 用 write 将 数据 写 人 文件 描述 符 ,用 read 从 文件 描述 符 读 出 数据 。 文 件 描述 符 可 
被 连接 到 磁盘 文件 .终端 和 外 部 设备 。 文 件 描述 符 指向 设备 也 动 程序 时 ,设备 驱动 程序 具有 
MRA WE 5.13 所 示 。 





打印 机 中 
LG 
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3. 下 一 章 的 内 容 
从 磁盘 读 取 数据 相对 容易 ,但 是 从 用 户 终 端 诅 取 有 点 麻烦 ,因为 人 是 不 可 项 知 的 ,需要 
用 户 输入 数据 的 程序 可 以 利用 终端 驱动 器 的 一 些 特别 的 连接 控制 功能 。 在 下 一 章 中 将 幸 细 
了 解 一 些 有 关 用 户 程 序 编 写 方 面 的 主题 ， 
4. 习题 
5.1 在 一 个 Linux 机 器 上 ,很 容易 读 取 忌 标 的 输出 。 做 这 个 工作 渍 要 处 于 文本 模式 ， 
在 shell 中 ,确保 称 为 gpm 的 程序 不 在 运行 : 输入 gpm -ks RAWA cat /dev/ 
mouse, Wa Bow ITER. db cat 从 设备 文件 中 读 取 数据 。 从 该 文件 读 取 
的 字 节 是 鼠标 产生 的 按键 次 数 和 移动 消息 


5.2 设备 文件 中 的 执行 位 是 什么 意思 ?学习 命令 biff, 考 虑 这 个 位 的 作用 ， 


53 前 面 已 经 讨论 了 设备 文件 的 输入 /输出 如 何 和 运作。 那么 像 In、mv 和 rm 等 的 目录 
操作 如 何 运作 呢 ? 利用 图 5.1, 解 释 这 三 个 命令 是 如 何 影 响 目录 i- 节点 和 了 驱动 程 
m. 
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命令 rm 和 系统 调用 unlink 删除 与 1- 节点 的 一 个 链接 。 如 果 该 L8 RS BERE 
降 为 0, 则 内 核 释放 磁盘 块 和 i- 节 点。 设备 1i- 节 点 没有 分 配 列表 和 数据 块 。 取 而 
代 之 的 是 设备 文件 的 i- 节 点 包含 指向 内 核 设 备 驱动 子 程序 的 指针 。 如 果 删 除 设 
备 的 文件 名 , 则 内 核 释 放 i- 节 点 ,驱动 程序 仍 朋 在 内 核 中 。 如 何 新 创建 一 个 文件 
连接 到 该 设备 呢 ? (提示; 阅读 mknod) 


考虑 为 文件 添加 内 容 时 的 资 争 情况 。 前 文中 的 讨论 描述 了 一 个 可 能 的 顺序 。 这 
两 个 进程 每 个 进程 有 两 个 操作 ,那么 有 多 少 种 顺序 组 合 的 可 能 性 呢 ?” 每 种 顺序 的 
结果 是 什么 ? 


查看 Linux ARR. RH O_APPEND 位 是 在 何 处 被 校 验 的 。 自 动 定位 是 如 和 何 
实现 的 ? 


系统 调用 rename 是 个 原子 操作 。 在 这 个 单一 的 调用 中 合并 了 哪些 步骤 呢 ” 查看 
Unix 的 内 核 代码 ,以 了 解 所 有 的 竞争 情况 和 内 核 处 理 的 可 能 冲突 。Linux 代码 中 
的 解释 有 些 饶 天 和 有 趣 。 


Jr HE FE PRK fopen 支持 以 添加 模式 打开 文件 。 例如 ,fopen ("data", "a™), 在 你 
的 系统 上 ,这 是 通过 添加 模式 开启 0_APPEND, 还 是 仅仅 在 打开 文件 后 定位 文件 
的 未 尾 来 实现 的 呢 ? 找到 fopen 的 源 代 码 , 或 者 编写 一 个 程序 添加 模式 两 次 打开 
同一 个 文件 ,然后 交替 向 两 个 流 写 数据 。 根 据 所 发 生 的 现象 能 得 到 什么 结论 ? 


例 程 echostate. c 报告 文件 描述 符 0 表示 的 驱动 器 回 显 位 的 状态 。 使 用 重 定向 符 
“一 ”将 标准 输入 定向 到 其 他 的 文件 或 设备 。 尝 试 以 下 试验 : 

echostate < /dev/tty 

echostate «7; /dev/lp 

echostate < /etc/passwd 


echostate < 'tty'! 


说 出 每 个 命令 行 的 输出 。 


.10 程序 setecho 改变 附加 在 标准 输入 的 驱动 程序 的 回 显 位 。 如 果 将 标准 输 人 重 定 


向 到 一 个 不 同 的 终端 ,就 可 以 改变 该 终端 的 回 显 位 。 

尝试 以 下 试验 。 

(1) 在 同一 各 机 器 上 登录 2 次 (或 在 机 器 上 打开 2 个 窗口 )。 

(2) 在 每 个 窗口 中 输 和 人 tty, 以 找到 那 两 个 窗口 的 设备 文件 名 。 假 设 一 个 连接 到 /7 
dev/ttyp1, 另 一 个 连接 到 /dev/ttyp2。 

(3) 在 ttypl ,输入 setecho n < /dev/ttyp2. 

OD Æ ttyp2 窗口 ,和 输 人 命令 echostate, 

(5) 然后 在 ttypl ,输入 echostate < /dev/ttyp2, 

(6) 解释 发 生 的 情况 。 

(7) 用 命令 stty 做 同样 的 试验 。 


DI 
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可 能 有 -- 天 ,你 会 发 现 这 个 功能 的 铺 很 有 用 ， 


前 文中 的 例子 为 tcgetattr 和 tesetattr 调用 使 用 的 文件 描述 符 的 值 为 0。 第 一 个 
参数 是 文件 描述 符 , 也 可 以 是 任何 指向 到 终端 设备 连接 的 值 。 

文件 描述 符 1 指向 标准 输出。 修改 echostate 和 setecho' 使 用 文件 描述 符 1 代替 
0。 这 个 变化 如 何 影 响 程 序 的 执行 ? 通常 标准 输入 和 标准 输出 指向 终端 。 解 释 
echostate 7 echostate, log 将 发 牛 什么 ? 使 用 文件 描述 符 0 有 什么 好 处 呢 ? 





如 果 想 建立 -个 接收 ppp 连接 的 系统 ,需要 安装 一 个 调制 解 调 器 ,并 且 配 置 串 行 
端口 。 串 行 接 11 的 终端 驱动 程序 应 该 被 配置 成 能 和 调制 解 调 器 协同 工作 。 阅 读 
X f / eic/gettydefs 和 /eteyinittab, 学 习 Unix 如 何 为 在 串 行 线 上 的 登录 定 广 终 
端 设置 。 


有 些 Unix 支持 三 种 版 本 的 O SYNC: 仅 数据 块 、 仅 i- 节 点 和 两 者 都 是 。 为 什么 
需要 确保 以 其 种 方式 写 人 ? 控制 这 3 种 类 型 的 标志 的 名 各 是 什么 ? 


在 一 个 终端 特殊 文件 上 的 读 和 写 的 权限 位 用 来 控制 什么 ? 使 用 tty 确定 你 的 终 
端的 名 字 ,然后 使 用 chmod 000 /dev/yourtty 将 你 的 终端 设置 成 对 你 来 说 也 不 可 
读 。 此 时 发 生 了 什么 情况 ? TA 


查看 你 系统 上 的 /dev 目录 ,找到 不 支持 read 操作 的 文件 ,不 支持 write 操作 的 文 
件 以 及 不 支持 lseek 操作 的 文件 。 


在 /dev 中 使 用 1s -1 找到 各 种 设备 的 最 大 数目 和 最 小 数目 。 你 看 到 了 什么 模式 ? 
什么 设备 具有 同样 的 最 大 数目 ?这 些 设备 有 什么 共同 点 ?它们 如 何 区 分 ? 


为 tty 驱动 器 设置 的 4 个 组 命名 。 解 释 每 个 组 的 上 月 的 ,并 在 每 个 组 中 命名 两 
个 位 。 


程序 使 用 tcsetattr 关闭 当前 终端 的 回 显 模式 。 当 那个 程序 存在 ,终端 处 于 无 回 
显 状态 。 另 方面, 当 程 序 打开 一 个 文件 并 使 用 fcntl 将 描述 符 置 于 O_APPEND 
模式 ,下 一 个 打开 这 个 文件 的 程序 不 能 获得 自动 添加 模式 。 解 释 这 个 明显 的 不 
— $8 D b 7j. 


到 终端 的 连接 是 个 正规 的 文件 描述 符 。 你 能 够 使 用 fentl 为 与 文件 描述 符 的 连接 
HEO APPEND mnm? 自动 添加 对 设备 来 说 是 什么 意思 ? 

ioctl 和 fenil Ja iS Ex BET A? 

A sk/dev 包含 文件 /qdevynull f/dev/zero, BB X [3E AS E39) A E HL dE 


它们 也 并 不 代表 做 盘 文 件 。 这 些 文件 是 用 来 做 什么 的 ? 为 什么 它们 是 有 四 的 ? 
Tk BE WB TE /dev 月 录 中 找到 虚拟 设备 的 其 他 文件 吗 , 就 像 这 两 个 文件 … 样 ? 
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5. 编程 练习 
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改进 这 章 中 write 的 简单 版 本 。 前 文中 的 版 本 要 求 用 户 输入 设备 文件 名 ,而 用 该 
版 本 并 不 显示 不 同 的 欢迎 用 语 。 编 当 一 个 新 版 本 ,能 够 接受 用 户 名 作为 参数 , 片 
在 屏幕 上 显示 你 想 通信 的 用 户 。 查 看 write 的 标准 版 本 显示 的 内 容 。 

你 的 程序 应 该 可 以 处 理 这 样 的 特殊 情况 : 你 想 聊 大 的 人 可 能 没有 登录 。 为 一方 
面 .你 想 铸 天 的 人 可 能 登录 了 若 十 个 终端 。 


不 想 被 那些 发 送 write 的 人 打扰 的 用 户 可 以 使 用 命令 mesg. 阅读 mesg. HU 
序 试验 以 了 解 它 如 何 工作 ,然后 写 一 个 这 样 的 程序 。 


通常 的 竞争 情况 包括 两 个 进程 同时 更 新 同一 个 文件 。 例 如 , 当 你 在 一 些 系 统 上 
修改 你 的 密码 ,程序 passwd 重 写 文件 /etc/ passwd。 如 果 两 个 用 户 同 时 修改 他 们 
的 密码 会 怎样 呢 ， 
一 种 防止 对 一 个 文件 进行 同时 访问 的 方法 是 利用 系统 调用 link. 的 一 个 重要 性 
Be. BRU RAS. 
"n 
+ tries to make a link called /etc/ passwd. LOK 
x returns 0 if ok, 1 if already locked, 2 if other problem 
int lock passwd() 
int rv = 0; . /* default return value x/ 
if ( link ("/etc/passwd", "/etc/passwd.LCK'") == - 1) 
rv = ( errno == EEXISTS ? 1 ;2 5; 
return rv; 
1 
《1) 如 果 两 个 进程 在 同一 时 刻 热 行 这 毁 代 码 , 只 有 一 个 会 成 功 。 系 统 调用 link 如 
何 使 用 有 效 的 方法 给 文件 上 锁 ? 
(2) 使 用 这 种 方法 编写 一 个 程序 ,将 文本 的 一 行 添加 到 一 个 文件 。 你 的 程序 需要 
尝试 建立 链接 。 如 果 链 接 成 功 ,程序 能 够 打开 文件 ,添加 行 , 然 后 删除 链接 。 
如 果 建 立 链接 失败 ,你 的 程序 需要 使 用 siecp(1) 等待 1s, 然 后 再 次 党 试 。 你 
需要 确保 你 的 程序 不 会 永 近 处 于 等 待 状态 。 
(3) 5€ — AH lock, passwd 的 unlock passwd BR. 
(4) AEN T fü ipt fA T EE BY 3c (T ES] XE Bn fapfi Bl link 编程 避免 
两 个 进程 创建 同样 的 文件 呢 ? 
(5) 学 习 命 令 vipw, vipw 2g i te Al ee dicis ? 


— 


RE- IB EE rs f fer [E FH ER aT RE EB, PHAR CIE E B EY A CIE COGC 
人 忻 时 ,文件 的 锁 必 须 被 删除 。 如 果 程 序 不 释放 锁 , 其 他 的 程序 将 会 永远 处 于 等 待 
状态 。 如 果 程 序 有 漏洞 ,在 它 释放 锁 之 前 月 溃 ,或 被 用 户 按 下 Ctrl-C 结束 ,将 会 
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怎样 ? 

一 种 解决 方法 是 拥有 锁 的 程序 每 卫 n 秒 修改 文件 。 程 序 可 以 使 用 ime 去 做 。 
等 待 锁 的 程序 可 查看 修改 时 间 , 检 查 锁 是 否 依然 有 效 。 如 果 锁 在 上 述 规定 的 癌 
也 中 未 被 修改 ,那么 其 他 的 程序 可 随意 删除 链接 ,然后 再 次 创建 链接 。 

编写 一 个 lock_passwd 的 新 版 本 ,使 之 带 有 表示 秒 数 的 数字 参数 。 这 个 新 版 本 能 
够 实现 上 面 所 描述 的 逻辑 。 


如 果 关 闭 缓冲 ,将 会 有 什么 影响 ?编写 一 个 程序 ,用 来 将 一 个 大 的 磁盘 文件 分 装 
在 小 的 片 里 面 ,例如 2MB 的 文件 被 分 装 在 16 字 节 的 片 的 集合 中 。 将 O0, SYNC 
开启 和 关闭 进行 试验 。 改 变 文 件 和 分 片 的 大 小 ,以 查看 它们 如 何 影响 结果 ， 


前 文 包含 了 关闭 文件 描述 符 磁盘 缓冲 的 代码 。 编 号 一 个 将 缓冲 重新 开启 的 程序 。 


编写 一 个 称 为 uppercase.¢ 的 程序 ,用 来 跟踪 终端 驱动 器 里 的 OLCUC 位 ,并 报告 
该 位 的 当前 状态 。 


stty ~a 的 输出 包 舍 终端 窗口 的 行 数 和 列 数 。 这 些 值 不 是 来 自 tegetattr 而 是 来 
自 icctl。 使 用 这 个 系统 调用 修改 第 1 章 的 more:, 使 它 能 够 使 用 终端 窗口 的 大 小 
显示 ,而 不 是 固定 值 24。 





6. 项目 
某 于 本 章 的 内 容 , 能 够 了 解 和 编写 以 下 这 些 Unix 程序 : 
write stty passwd wall biff .nt 磁带 控制 程序 ,可 能 你 的 系统 上 没有 ) 
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概念 与 技巧 

。 软件 工具 与 用 户 程序 

© 读 取 和 修改 终端 驱动 程序 的 设置 

- 终端 驱动 程序 的 模式 

。 非 阻塞 输入 

。 用 户 输入 的 超时 

。 对 信 竺 的 介绍 : Cult 是 如 何 工作 的 
相关 的 系统 调用 

* fentl 


* signal 


6.1 软件 工具 与 针对 特定 设备 编写 的 程序 


在 Unix 系统 ,虽然 设备 看 起 来 很 像 爸 盘 文 件 ,但 是 设备 是 不 同 于 磁 鼻 文件 的 。 在 第 5 
章 中 已 经 看 到 ,程序 能 对 设备 执行 open.close, read, write 和 lseek 操作 ,但 是 也 已 经 看 到 设 
备 有 相应 的 驱动 程序 ,那些 驱动 程序 包含 许多 与 设备 相关 的 控制 和 属性 。 程 序 如 何 认 识 这 
PPR ETE? 

l. HLE: A stdin & LHRA, FB $] stdout 

对 磁盘 文件 和 设备 文件 不 加 以 区 分 的 程序 被 称 为 软件 工具 。Unix 系统 有 好 几 百 个 软件 
工具 ,包括 who.s.sort,unig.grep.tr 和 du。 软件 工具 使 用 图 8. 1 所 示 的 模型 。 

软件 工具 从 标准 输入 读 联 字 节 ,进行 一 些 处 理 , 然 后 将 包含 结果 的 字 节 流 写 到 标准 输 
出 。 工 具 发 送 错误 消息 到 标准 错误 输出 ,它们 也 被 当做 简单 的 字 节 流 来 处 理 。 这 些 文件 措 
述 符 能 够 连接 到 文件 ,终端 .鼠标 .光电 管 ,打印 机 和 管乐器 ; 工具 对 所 处 理 的 数据 的 源 和 目 
的 地 不 做 任何 很 设 。 其 他 很 多 程序 也 能 从 命令 行 所 指定 的 文件 中 读 取 数据 ， 
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事实 : 大 多 数 进程 
自动 将 前 3 个 文件 
HEET- 它们 
不 需要 调用 opent) 
来 建立 连接 





图 6.] 3 种 标准 文件 描述 符 


这 些 程 序 的 输入 和 输出 能 够 裤 重 定向 到 任何 类 型 的 连接 上 ， 


$ sort > outputfile 
S sort x > /dev/lp 
S who | tr '[a- z]' '[A- Z]" 


2. 特定 设备 程序 : 为 特定 应 用 控制 设备 

其 它 程序 (如 控制 扫描 仪 .记录 压缩 盘 .操作 磁带 驱动 程序 和 拍摄 数码 相片 的 程序 ?也 能 
同 特定 设备 进行 交互 。 在 本 章 中 将 通过 了 外 最 常见 的 与 特定 设备 相关 的 程序 (通过 终端 与 
人 交 瑟 的 程序 ) 来 探讨 在 写 这 些 程序 时 用 到 的 概念 和 技术 。 将 这 些 面向 终端 的 程序 称 为 用 
PRI. 

3. 用 户 程序 ， 一 种 常见 的 设备 相关 程序 

用 户 程 序 的 例子 有 vi.emacs,pine.more,lynx, hangman, robots 和 许多 加 利 福 尼 亚 大 学 
伯克利 分 校 编写 的 游戏 程序 2。 这些 程 序 设置 终端 驱动 程序 的 击 键 和 输出 处 理 方 式 。 驱 动 
程序 有 很 多 设置 ,但 是 用 户 程序 常用 到 的 有 : 

(1) 立即 响应 击 键 事件 

(2) 有 限 的 输入 集 

(3) 输入 的 超时 

(4) BRR Ctrl-C 

下 面 将 通过 编写 一 个 实现 所 有 这 些 特 点 的 程序 来 学 习 这 些 主题 。 


6.2 终端 驱动 程序 的 模式 


首先 讨论 在 前 面 章节 中 提 到 的 终端 驱动 程序 。 下 面 通 过 一 个 简短 的 转换 程序 来 深入 理 
解 设 备 驱 动 程序 的 细节 呈 ; 





D ”这些 程序 的 源 代码 可 以 在 网 上 找到 ,村 找 bsdgames 
CQ 可 以 用 上 命令 做 同样 的 事情 .但 是 tr 的 GNU ARMAS RRA REE RT RAAT. 
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/* rotate.c : map a ->b, b->c, 7. z->a 
* purpose;useful For showing tty modes 
"f 


# include « stdio. h> 
H include <ctype. h> 


int mainO 
1 
int c; 
while ( ( c7 getchaz() ) = FOF ){ 
1f Ce == 'z') 
c= ar‘; 


else if (islewer(c)) 
ctt, 


putchar(c); 


6.2.1 规范 模式 : 缓冲 和 编辑 
使 用 默认 设置 运行 这 个 程序 (<- BIRR). 


$ œ rotate.c - o rotate 
$ ./rotate 

abx< - cd ， 

bede 

efgCtrl 一 C 

S 


图 6.2 ER Tm, ALK rotate 程序 和 数据 流 。 





Rotale ER FF 


Tere ee 


图 6.2 和 萌 人 的 内 雁 和 程序 所 得 到 的 内 容 


上 述 的 实验 揭示 了 标准 输入 处 理 的 如 下 特征 ， 


cn 


ot 
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(1) 程序 未 得 到 输入 的 “x", 这 是 因为 退 格 键 删除 了 它 ， 

(2) 击 键 的 同时 字符 显示 在 屏幕 上 ,但 是 直到 按 了 回 车 键 ,程序 才 接 收 到 和 输 人 : 

(3) Ctrl -C 键 结束 输入 并 终止 程序 。 

程序 rotate 不 做 这 些 操作 。 缓 冲 . 回 显 、 编 辑 和 控制 键 处 型 都 由 驱动 程序 完成 。 图 6. 3 
显示 了 驱动 程序 中 的 操作 层次 。 


SAL IERI: 






输入 编辑 
Yr Nr ERE ON n” 





图 6.3 终端 驶 动 器 中 的 处 理 层 


缓冲 和 编辑 包含 规范 处 理 (canonical processing)。 当 这 些 特 征 被 启动 ,终端 连接 被 称 为 
处 于 规范 模式 ， 


6.2.2 非 规范 处 理 
现在 , 蔡 成 这 个 试验 (输入 仍旧 是 abx<- cd, 然后 ,输入 elg Ctrl-C); 


$ stty - icanon; . /rotate 
abbcxy*? cdde 
ettgqh 


§ stty icanon 


ia stty ~icanon XAT BABY BEF (P BAL SB CARES. J- BSE MAY REAR 3E HL At AG 
各 个 侧 商 ,而 只 是 演示 了 给 和 人 处理 方 式 被 改变 了 。 

trn. ELA BER Ae, MATE a”, 驱动 程序 跳 过 缓冲 层 ,将 字符 直接 送 到 程 
fF rotate, 然 后 程序 显示 字符 “b”"。 用 户 输入 未 被 缓冲 可 能 是 一 件 麻烦 事 。 当 用 户 试图 删除 
一 个 字符 . 驶 动 程序 不 能 做 任何 事情 ; 字符 早 就 送 给 程序 了 ， 

最 后 一 个 试验 . 尝 滤 以 下 命令 ,然后 再 次 输入 “abx 一 - cd fH" cfg" Cir] - C. 

$ stty - icanon - echo ; . /rotate 

bcy*? de 

Egh 

S stty icanon echo (注意 ; 你 看 不 到 这 个 。 为 什么 ?) 


在 这 个 例子 中 关闭 了 规范 模式 和 回 显 模式 。 驱动 程序 不 再 显示 所 输 人 的 字符 。 输 出 
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仅 痰 自 程序 。 当 退出 这 个 程序 时 ,了 驱动 程序 仍旧 处 于 无 回 显 、 非 规范 模式 中 ,并 且 一 直 处 
于 那 种 状态 直到 程序 改变 了 设置 。shell 打印 一 个 显示 符 , 等 待 下 一 行 命令 。 育 些 shell & 
PUR hee, AEA. MA shell 并 不 重 置 驱动 程序 ,将 继续 处 于 无 回 显 . 非 规 范 
的 模式 中 。 


6.2.3 终端 模式 小 结 


WRK MS RLS MERK. REHEAT RRB KABA. 
BUS Unix 设计 用 户 程序 时 ,需要 决定 哪 种 终端 模式 适合 这 个 应 用 。 

l. 规范 模式 

规范 模式 .也 被 称 为 cooked 模式 ,是 用 户 常见 的 模式 。 了 驱动 程序 输入 的 字符 保存 在 缓冲 
区 ,并且 仅 在 接收 到 侣 车 键 % 时 才 将 这 些 缓冲 的 字符 发 送 到 程序 . 缓 肿 数据 使 驱动 程序 可 以 
实现 最 基本 的 编辑 功能 ,如 删除 字符 .单词 或 整 行 。 当 用 户 分 别 按 下 删除 键 A RR 
是 终止 键 时 ,这 些 功能 就 会 被 凋 用 。 被 指派 到 这 些 功能 的 特定 键 在 驱动 程序 里 设置 ,可 通过 
命令 sttv Be BEV FA tcsetattr KEH. 

2， 非 规范 模式 

当 绥 冲 和 编辑 功能 被 关闭 时 ,连接 被 称 为 处 于 非 规范 模式 。 终端 处 理 器 仍旧 进行 特定 
的 字符 处 理 , 例 如 ,处 理 Ctrl-C 及 换行 符 和 回 车 符 之 间 的 转换 。 但 是 ,用 于 删除 .单间 删除 
和 终止 的 编辑 键 没有 特殊 的 意义 ,因此 相应 的 输入 被 视 作 常 规 的 数据 输入。 

如 果 用 非 规范 模式 编写 程序 ,并 且 逢 望 用 户 能 够 编辑 他 们 的 输 人 ,需要 在 你 的 程序 中 实 
项 编辑 功能 。 

3. raw 模式 

每 个 处 理 步 又 都 被 一 个 独立 的 位 控制 。 例 如 ,1SIG 位 控制 Ctrl-C 键 是 否 用 于 终止 一 个 
程序 。 程 序 可 随 必 关闭 所 有 这 些 处 理 步 又 。 

当 所 有 处 理 都 被 关闭 后 ,驱动 程序 将 
输入 直接 传递 给 程序 。 在 这 种 情况 下 , 驱 
动 程序 被 称 为 处 于 raw 模式 。 在 终端 驱动 
程序 更 为 简单 的 老 版 本 系统 中 ,有 个 特定 
AY EL BR A raw 模式 。 命令 suy 支持 ub 
raw 模式 ,将 它 作为 命令 行 的 一 个 选项 。 联 BEE 
机 帮助 上 有 关 suy 的 部 分 解释 了 raw 模式 B 
的 含义 。 

终端 驱动 程序 是 内 核 中 一 些 复杂 的 性 
序 。 通 过 前 面 的 学 习 和 试验 可 以 更 为 清楚 
地 了 解 它 们 的 名 个 组 成 部 分 和 功能 。 图 6.4 图 6.4 终 喘 驱动 程序 的 主要 组 成 部 分 
显示 了 其 主要 部 分 。 








@ 或 者 是 当前 定义 的 EOF 蚀 .通常 为 Ctrl-D。 
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各 种 模式 都 有 各 自 特 定 的 用 途 。 为 了 帮助 理解 这 些 模式 的 实际 应 用 价值 ,下 面 开 发 了 
一 个 使 用 不 同 模式 的 用 户 程序 。 


6.3 编写 一 个 用 户 程序 : play_again. c 


RERE RERUERPE G9] 80. FL un CK EUCH SE BLOGO. AE: m HIP EHI yes/no 的 问题 。 
以 下 程序 脚本 是 一 个 银行 应 用 程序 的 主 特 环 ， 


#4 /bin/sh 
# 
£ atm.sh ~ a wrapper for two programs 
# - 
while true 
do 
do a transaction # run a program 
if play again # run our program 
then 
continue d ify loop back 
fi 
break # if "n" break 
done 


就 像 其 他 典型 的 Unix 风格 的 程序 ,这 个 银行 脚本 程序 将 程序 的 各 个 组 件 组 合 起 来 。 第 一 
个 组 件 是 一 个 称 为 do_a_transaction 的 程序 ,完成 ATM ITE. 第 二 个 组 件 play again. A RIP 
那 几 得 到 “是 ”或 “ 否 ” 的 回答 。 下 面 实现 第 二 个 组 件 程 序 。 这 样 的 组 件 架 构 允 许 方便 地 更 换 不 
间 版 本 的 play again. 

play. again. c 的 逻辑 很 简单 : 

*。 对 用 户 显示 提示 问题 

。 接受 输入 

© BR dE" y" REO 

。 B] E Re" n" RE 1 

1, 例子 ， play againO. c 





ZR iE E 


/* play againÜ.c 
* purpose; ask if user wants another transaction 
* nethod: ask a question, wait for yes/no answer 
* returns; 0 -— yes, 1 no 
* better: eliminate need to press return 
af 
4 include <istdio, h> 


f include ‘termios.h > 


#define QUESTION "Do you want another transaction" 
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int get response( char * ); 


int maint) 
! 
int response: 
response = get response(QUESTION); /x get some answer x/ 
return response; 
} 
int get_response(char x question) 
/* 
* purpose; ask a question and wait for a y/n answer 
* method: use getchar and ignore non y/n answers 
* returns; 0 => yes, 1 =">no 
x/ 
i 
printf(" & s (y/n)?", question); 
while(1){ 
switch( getchar() ){ 
case 'y’; 
case 'Y': return 0; 
case 'n': 
case 'N': 


case EOF; return i; 


} 


这 个 程序 显示 提示 问题 ,然后 循环 读 取 用 户 的 输入 ,直到 用 户 输 入 J 人 “y”、“n”、“Y” 或 
“N” 才 停止 。play_again0 有 两 个 问题 ,这 两 个 问题 都 由 运行 时 处 在 规范 模式 引起 。 首 先 , 用 
户 必须 按 回 车 键 ,play_again0 才能 接受 到 数据 。 第 二 , 当 用 户 按 回 车 键 时 ,程序 接收 整 行 的 
数据 并 对 其 进行 处 理 。 因 此 ,play_again0 把 下 面 的 输入 作为 一 个 否定 的 回答 ， 


$ play _again0 
Do you want another transaction (y/n) ? sure thingl 


SS — TE Je PAL TS 88 ALL (E TERR EE E 37^ Rc SERIO E SB TAS. 
即时 响应 





2. 例子 : play againl.c 


/* play againl.c 
* purpose: ask if user wants another transaction 
x method: set tty into char - by - char mode, read char, return result 
* returns: 0-7-yes, 1 =>> no 
* better: do no echo inappropriate input 
" 


4 include <istdio. h> 
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# include <“termios. h> 
# define QUESTION “Do you want another transaction" 


maint 》 


{ 


int response; 


tty_mode(0) ; /* save tty mode */ 

set crmode(); /* set chr - by- chr mode «/ 
response = get response(QUESTION); /* qet some answer x/ 

tty mode(1); /* restore tty mode «/ 


return response; 
í 
int get response(char * question) 
ix 
x purpose; ask a question and wait for a y/n answer 
x method: use getchar and complain about non y/n answers 
» returns; 0-7» yes, 1 57 no 
wf 
1 
int input; 
printf("$ s (y/n)?", question); 
while(1) { 
switch( input = getchar() ){ 
case 'y': 
case 'Y!': return Q; 
case 'n': 
case 'N'; 
case EOF; return 1; 
default: 
printf(" Mncannot understand %c, ", input); 


printf( "Please type y or no Xn"); 


\ 
! 


set crmode() 
/* 
* purpose. put file descriptor 0 (i.e. stdin) into chr - by - chr mode 
x method: use bits in termios 
xf 
{ 
struct termios ttystate; 
tegetattr( 0, &ttystate); /* read curr, setting «/ 
ttystate.c lflag &= --ICANON; /x no buffering */ 
ttystate.c cc[VMIN] = 1; /* get 1 char at a time x/ 
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tcsetattr( 0 , TCSANOW, &ttystate) - /* install settings */ 
} 
/* hon == 0 => gave current mode, how == 1 => restore mode */ 
tty mode(int how) 
i 
static struct termios original mode; 
if ( how == 0) 
tcgetattr(0, Eoriginal mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


1 


play. againl 首先 将 终端 置 于 一 个 字符 接着 一 个 字符 的 模式 (ceharacter - by ~ character 
mode) ,然后 调用 函数 显 失 一 个 提示 符 , 并 获得 一 个 响应 ,最 后 设置 终端 为 原始 的 横 式 。 注 
意 , 最 后 并 未 将 终端 置 于 规范 模式 。 取 而 代 之 的 是 ,将 原先 的 设置 复制 到 一 个 称 为 original_ 
mode 的 结构 中 ,结束 时 恢复 这 些 设 置 ， 

将 终端 置 于 字符 输入 模式 包括 两 部 分 工作 。 除 了 将 CANON 位 关闭 外 ,还 要 将 值 1 分 
配给 控制 字符 数组 中 以 VMIN 为 下 标的 元 素 。VMIN 的 值 告 诉 驱动 程序 一 次 可 以 读 取 多 少 
个 字符 。 因 为 希望 一 个 接 一 个 地 读 取 字符 ,所 以 将 这 个 值 置 为 1。 如果 和 希望 一 次 讯 取 3 TUE 
符 了 , 则 可 将 值 置 为 3。 

编译 并 运行 这 个 程序 ,输入 sure 作为 回答 ，; 


$ make play againf 

cc play againl.c -o play againl 

$ . /play againl 

Do you want another transaction (y/n)? s 
cannot understand s, Please type y or no 
u 

cannot understand u, Please type y or no 
r 

cannot understand r, Please type y or nn 
e 

cannot understand e, Please type y or no 


YS 


像 预期 的 那样 ,play_ againl 接收 和 处 理 字符 ,而 太 再 等 待 回 车 键 。 但 是 对 每 个 非法 字符 
都 提示 错误 信息 可 能 让 人 觉得 比较 烦 。 一 个 更 好 的 设计 是 关闭 回 显 模式 ,丢掉 不 需要 的 字 
符 , 直 到 得 到 可 接受 的 字符 为 止 。 


D 实际 二 我 用 这 个 处 理 功能 键 。 在 很 多 键盘 上 ,功能 键 发 送 多 个 字符 序列 ,例如 escape 表示 -[ -1- 1 一 。 当 键盘 
WEB escape 字符 (ASCII 27) EME -REAA ERI 个 或 4 个 字符 ， 
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3. A-F: play again2, c-— 4 wi 3E Kee 


/* play again2.c 
# purpose: ask if user wants another transaction 
x method. set tty into char — by- char mode and no - echo mode 
x read char, return result 
* returns; 0 => yes, 1 7>no 
» better: timeout if user walks away 
x 
x/ 
# include <stdio.h> 


Hf include <“termios. h 
# define QUESTION "Do you want another transaction" 


maint } 
1 


int response; 


tty mode(0); /* save mode */ 

set cr noecho mode(); /* set - icanon, - echo «/ 
response = get response( QUESTION) : /* get some answer »/ 

tty _mode(1); /* restore tty state «/ 


return response; 
} 
int get_response(char * question) 
/* 
* purpose; ask a question and wait for a y/n answer 
* method; use getchar and ignore non y/n answers 
* returns: 0 => yes, 1 —no 
af 
{ 


printf("& s (y/n) ?", question); 


while(i1)i 
switch( getchar() ){ 
case 'y'; 


case 'Y': return 0; 
case 'n!- 
case !N': 


case EOF; return 1; 


1 


set cr noecho modal > 
fe 
* purpose; put file descriptor 0 into chr ~ by- chr mode and noecho mode 
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x method: use bits in termios 
xj 
{ 


struct termios ttystate; 


tegetattr( 0, &ttystate) ; /* read curr. setting x/ 
ttystate.c lflag  &- ~ICANON; /* no buffering */ 
ttystate.c lflag &= --ECHO; /* no echo either «/ 
ttystate.c ec[ VMINII = 1]; /* get 1 char at a time */ 
tcsetattr( 0 , TCSANOW, &ttystate); /* install settings */ 

} 

/* how == 0 => save current mode, how == 1 => restore mode »/ 


tty_mode int how) 
í 
static struct termios original_mode; 
if ( how == 0) 
tcgetattr(0, &original mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


} 


这 个 程序 和 前 商 的 版 本 在 两 个 方面 有 所 不 同 。 设 置 终端 驱动 程序 的 函数 关闭 了 回 显 
人 位。 注意, 恢复 函 数 不 需 要 特意 将 该 位 开启 。 荔 一 个 变化 是 函数 get. response 不 再 提示 错误 
信息 ,而 仅仅 是 忽略 它们 。 

编译 并 运行 这 个 程序 。 如 果 输 入 sure, 没 有 显示 任何 内 容 。 仅 当 输 人 了 或 n 时 ,程序 
返回 。 

play again? 如 所 希望 的 那样 运行 ,但 是 它 还 有 竺 改进。 如 果 这 个 程序 运行 在 真正 的 
ATM 上 ,而 顾客 在 输 人 y Ro 之 前 走 开 了 ,将 会 怎样 ? 下 一 个 顾客 跑 过 来 按 下 y, 就 能 进 人 
那个 离开 的 顾客 的 三 号 。 所 以 如 果 用 户 程序 包含 超时 特征 ,会 变 得 更 安全 。 


JERR ERA: play again3.c 


下 一 个 程序 版 本 会 有 超时 特征 。 通过 设置 终端 驱动 程序 ,使 之 不 等 待 输 人 来 实现 这 个 
特征 。 先 检查 看 是 否 有 输入 ,如 果 发 现 没 有 输入 , 则 先 睡 眠 几 秒 钟 ,然后 继续 检查 输入 。 如 
此 尝试 3 次 之 后 放弃 。 

1. 阻 赛 与 非 阻 塞 输入 

当 调 用 getchar 或 read 从 文件 描述 符 读 取 输 人 时 ,这 些 调用 通常 会 等 待 输入 .在 play_ 
again 例子 中 ,对 getchar 的 调用 使 得 程序 一 直 等 待 用 户 的 输入 ,直到 用 户 输 人 一 个 字符 。 程 
序 被 阻 赛 ,直到 能 获得 某 些 字符 或 是 检测 到 了 文件 的 末尾 。 那么 如 何 关 闭 输 人 阻塞 呢 ? 

阻塞 不 仅仅 是 终端 连接 的 属性 ,而 是 任何 一 个 打开 的 文件 的 属性 。 程 序 可 以 使 用 fentl 
或 open A X. (+ FR YR f$ A oh AE BH 3€ ifs A (nonblock input), play again3 使 用 fent! 为 文件 措 
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述 符 开启 O NDELAY® 标志 。 

美 闭 一 个 文 伯 描述 符 的 阻塞 状态 并 调用 read。 结 条 如 何 呢 ? 如 果 能 够 获得 输入 ,tread 
获得 输入 并 返回 所 获得 的 字符 个 数 。 如 时 没有 输入 字符 ,read ii [e] 0. RBA PA FE 
. 一样。 如 此 有 错误 ,read 返回 一 1。 

非 阻 塞 操 作 的 内 部 实现 相当 篇 单 。 每 个 文件 都 有 一 块 保存 未 读 取 数据 的 地 方 , 如 图 6. 4 
所 示 的 驱动 程序 里 最 顶端 的 存储 方 执 。 如 果 文 件 措 述 符 置 了 OQO_NDELAY 位 ,并 且 那 块 空间 
是 空 的 ,read 调用 返回 0。 如果 能 阅读 与 D_NDELAY 有 关 的 的 Linux 源 伐 码 ,就 可 以 了 解 
到 实现 的 细节 。 


2. WF: play again3. c——4& M 4E F8 X 4E X, Sz ELA qp ve A 





/* play again3.c 
* purpose: ask if user wants another transaction 
* method; set tty into chr- by- chr, no- echo mode 
* set tty into no - delay mode 
* read char, return result 
* returns; 0 => yes, 1 =>no, 2 -— timeout 
* better; reset terminal mode on Interrupt 
af 
# include < stdio. h> 
d include <(termios. h> 
# include <(fcntl. h> 
# include «string, h> 


#define ASK Do you want another transaction" 


Hdefine TRIES 3 /* max tries x/ 
define  SLEEPTIME 2 /* time per try «/ 
# define BEEP  putchar( 'Ma') /* alert user »/ 
main() 


4 


int response; 


tty node(0); /* save current mode x/ 
set cr noecho mode(); /* set — icanon, — echo */ 
set nodelay mode(); /* noinput =>> EOF x/ 


response = get response(ASK, TRIES); /x get some answer x/ 
tty mode(1); /* restore orig mode »/ 
return response: 


} 


get response( char » question , int maxtrics) 


fx 


* purpose; ask a question and wait for a y/n answer or maxtries 





Qo thal ith A OLNONBLOCK 位 ,请 查阅 联机 帮助 。 
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* method. use getchar and complain about non- y/n input 
* returns; Ù => yes, 1 -7no, 2 =>timeout 

«i 

{ 


int input; 


printf("& s (y/n)?", question); fs ask «/ 
fflush( stdout); /* force output «/ 
while ( 1 ){ 
Sleep( SLEEPTIME) ; /x wait a bit «/ 
input - tolower(get ok char()); /* get next chr «/ 
if ( input == 'y') 
return 0; 
if ( input == 'n' J 
return i; 
if ( maxtries-- == 0) /* outatime? x/ 
return 2; /* Sayso «/ 
BEEP; 


} 


/* 
* skip over non- legal chars and return y,¥,n, or EOF 


x/ 
get ok char() 
1 
int c; 
while( ( c = getchar() ) 1= EOF && strchr("yYnN",c) == NULL) 
return c; 
} 
set cr noecho mode() 
fe 
* purpose: put file descriptor 0 into chr - by- chr mode and noecho mode 
x method: use bits in termios 
xf 
$ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr. setting x/ 
ttystate.c lflag &= ~ICANON; /* no buffering «/ 
ttystate.c lflag &= — ECHO; /* no echo either x/ 
ttystate.c, cc[ VMIN) 21; /* get 1 char at a time x/ 


tesetattr( 0 , TCSANOW, &ttystate); 


/* install settings xy 
1 

set nodelay mode() 

fx 
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* purpose: put file descriptor 0 into no 一 delay mode 
x method: use fentl to set bits 
* notes: tcsetattr() will do something similar, but it is complicated 
xi 
{ 


int termflags; 


termflags = fcntl(0, F_GETFL); /* read curr. settings */ 
termflags | = O NDELAY; /* flip on nodelay bit x/ 
fcntl(0, F SETFL, termflags); /* and install rem */ 

} 

/* how == D =>> save current mode, how == 1 => restore mode */ 


/* this version handles termios and fcntl flags */ 
tty mode(int how) 
í 
static struct termios original mode; 
static int original flags; 
if ( how == 0) 
tegetattr(0, &original mode); 
original flags = fcntl(0, F_GETFL); 
} 
else | 
tesetattr(0, TCSANOW, &original mode); 
fentl( 0, F SETFL, original flags); 
} 
} 


程序 的 这 个 版 本 有 一 些 新 特点 。 首 先 使 用 fent 关闭 和 开启 非 阻塞 模式 ,其 次 在 get 
response 中 使 用 sleep 和 计数 器 maxtries。 

3. play again3 的 小 问题 

play again3 并 不 是 理想 的 。 运 行 在 非 阻 蹇 模式 ,程序 在 调用 getchar 给 用 户 输 人 字符 之 
前 睡眠 2s。 就 算 用 户 在 1s 内 完成 输入 ,程序 也 要 在 2s 后 才 得 到 字符 。 用 广 可 能 会 感到 迷 
R: “RAR GMAT OG? 怎么 设 反映 呢 ” 难道 说 我 弄 错 了 ?” 

可 以 使 程序 更 快 地 做 出 响应 吗 ? 可 以 减少 每 次 调用 getchar 间 的 睡眠 时 间 , 并 相应 地 增 
加 循环 次 数 来 实现 相同 的 超时 设置 。 

另外 ,注意 在 显示 提示 符 之 后 对 fflush 的 调用 。 如 果 没 有 那 一 行 ,在 调用 getchar 之 前 ， 
提示 符 将 不 能 显示 。 究 其 原因 是 ,终端 驱动 程序 不 仅 ~… 行 行 地 绥 溃 输入 ,而 且 还 一 行 行 地 组 
剖 输 出 。 驱 动 程序 缓冲 输出 ,直到 它 收 到 一 个 换行 符 或 者 程序 试图 从 终端 读 取 输入 。 在 这 
个 例子 中 ,为 了 给 用 户 读 提 示 符 的 时 间 ,需要 延迟 恋人 。 这 样 就 必须 调用 iflash, 

4. 实现 超时 的 其 他 方法 

Unix 提供 更 好 的 方法 来 实现 超时 功能 ,在 驱动 程序 中 设置 数组 c_ccL ] 中 的 元 素 VTIME 
将 超时 功能 的 实现 移 至 终端 驱动 程序 。 本 章 的 一 个 练习 提供 了 相关 细节 。 系 统 调 用 select 
包 舍 一 个 超时 参数 .将 在 后 面 的 章节 中 讨论 select, 
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5. play again3 的 一 个 大 问题 
play_again3 般 略 它 所 不 想 要 的 字母 ,识别 和 处 理 全 法 输入 ,并 在 规定 的 时 间 间隔 内 无 合 
法 输入 的 情况 下 自动 退出 。 但 是 如 桌 用 广 输 入 Ctrl-C 将 会 如 和 何 ?下面 是 它 的 运行 情况 : 


$ make play again3 

cc play again3.c - o play adqain3 

$. /play again3 

Do you want another transaction (y/n)? press Ctrl C now 
$ logout 

Connection to host closed. 

bashs 


当 按 下 Ctrl-C EEF play again, APL Ip T XTRA ea PRT ERS 
话 。 这 是 为 什么 呢 ? play again3 有 3 SR. 初始 化 .获得 用 户 输 人 和 恢复 设置 ,如 在 图 6. 5 
中 描述 的 那样 。 
es 
初始 控制 流 、 | 设置 crmode 





显示 提示 符 当 读 取 终 止 时 的 流向 

| 等 待 用 户 输入 
a M MEER —- 进程 被 终止 
"d APRA 


| 恢复 ty 设置 





SIGINT 


进程 正常 授 出 时 的 流向 一 | 恢复 fentl 标志 
Y 退出 
进程 正常 退出 
图 8.5 Ctrl-C 终 止 进程 并 将 终端 置 于 未 恢复 状态 


初始 化 部 分 将 终端 置 于 非 芽 塞 输 人 状态 。 程 序 随后 进入 主 循环 并 打 印 提示 ,睡眠 和 读 


取 答 入 。 然 后 在 程序 运行 中 通过 按 Ctrl-C 键 来 终止 程序 。 那 么 终端 驱动 程序 处 于 什么 
状态 ? 


实际 上 程序 会 立刻 退出 ,而 不 执行 重 置 驱动 程序 的 代码 。 当 返 问 shell 显示 提示 符 并 从 
用 户 处 获得 命令 行 时 ,终端 仍旧 处 于 非 阻 塞 模式 。shell 调用 read 获取 命令 行 ,但 是 内 为 处 
于 非 阻 塞 状态 read 立即 返回 0。 总 之 ,程序 结束 时 文件 措 述 符 处 于 一 个 错误 的 状态 。 下 一 
个 目标 是 学 习 如 何 避 免 程序 被 Ctrl-C 鲁莽 地 杀 死 。 

6 为 什么 有 些 情况 下 不 会 被 注销 ? 

很 多 Unix shell 包含 编辑 特征 ,如 使 用 箭头 键 在 执行 过 的 命令 列表 中 滚动 。 这 些 shell 
运行 在 实现 这 些 功 能 上 所 需要 的 raw 模式 下 ， 当 程序 退出 或 死亡 时 , 像 bash 和 tesh 这 些 shell 
立即 重 置 终 端的 届 性 。 
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6.4 信 号 


Ctrl-CG 中 断 当前 运行 的 程序 。 这 个 中 断 由 一 个 称 为 信号 的 内 核 机 制 产 生 。 信 号 是 一 个 
简单 而 重要 的 概念 。 下面 将 探讨 信号 的 基本 概念 .学 习 怎 翌 使 用 它们 解决 play_again3 的 问 
题 。 在 下 一 章 中 将 更 深入 地 学 习 信 号 。 


6.4.1 Ctrl 一 C 做 什么 


输入 Ctrl-C, 程 序 便 被 终止 了 。 一 个 单一 的 击 键 是 如 何 杀 死 一 个 进程 的 呢 ?” 和 终端 驱动 
程序 在 这 里 起 了 相应 的 作用 , 图 6.6 显示 了 相应 的 事件 链 。 








. 用户 输 入 Ctrl-C 

. Es FERT E ST TE 

,匹配 VINTR 和 ]SIG 的 字符 被 开启 
. cs 2H WW RE EE RK 

， 信 号 系统 发 送 SIGINT HAR 

. dt AY SI SIGINT 

. WARE 








A gt — LO P3 — 





46.6 Ciri- emr 


Pirta m A d BAS KR GE dEJÉ Cul -C, 可 以 使 用 suy (或 者 rcsetattr) 将 当前 的 
VINTR dipl SFT RRA — BE. 


6.4.2 信号 是 什么 


RE Cul-C 产生 一 个 信和 号 ,那么 信 生 是 什么 呢 9 信和 号 是 由 单个 词组 成 的 消息 。 绿 灯 是 
一 个 信号 ,停止 标牌 是 一 个 信号 ,裁判 手势 也 是 一 个 信号 。 这 些 物 体 和 事件 不 是 消息 , EP 
和 出 界 才 是 消息 。 当 按 Cirl-C 于 ,内 核 向 当前 正在 运行 的 进程 发 送 中 断 信号 。 每 个 信号 都 
有 一 个 数字 编码 。 中 断 信号 通常 是 编码 2.” 

信号 从 哪里 来 ”信号 来 自 内 核 , 生 成 信号 的 请 求 来 自 3 个 地 方 ,如 图 6.7 Bron. 

(1) AIR 

用 户 能 够 通过 输入 Ctrl-C、Ctrl-\ ,或 是 终 疾 驱动 程序 分 配给 信号 控制 字符 的 其 他 任何 
键 来 请 求 内 核 产生 信和 号 。 

(2) AR 

当 进 程 执行 出 错时 ,内核 给 进程 发 送 一 个 信号 ,例如 ,非法 县 存 取 SAMY SE — 





O BREE 4S shell MEM HB, 








第 6 章 为 用 户 编程 : Mints il Mf S ec 169 > 











(3) 进程 





来 自 其 他 进程 的 信和 号 








来 自 异常 的 信号 SERERE 


图 6.7 信号 的 3 种 来 源 


个 非法 的 机 器 指令 。 内核 也 利用 信号 通知 进程 特定 事件 的 发 生 。 


一 个 进程 可 以 通过 系统 调用 kill 给 另 一 个 进程 发 送信 和 号。 一 个 进程 可 以 和 男 一 个 进程 


通过 信号 通信 。 


由 进程 的 其 个 操作 产生 的 信和 号 被 称 为 同步 信和 号 (synchronous signals). HUM, BEM. 


由 像 用 户 击 键 这 样 的 进程 外 的 事件 引起 的 信号 被 称 为 异步 信号 (asynchronous signals? , 


哪里 可 以 找到 信号 的 列表 ? 信号 编号 以 及 它们 的 名 字 通 常 出 现在 /usr/include/signal.hb 


f define SIGHUP 
# define SIGINT 
# define SIGQUIT 
4 define SIGILL 
# define SIGTRAP 
# define SIGABRT 
4 define SIGEMT 
# define SIGFPE 
# define SIGKILL 


1 
2 
3 
4 
5 
6 
7 
8 
9 


文件 中 。 这 里 是 这 个 文件 的 一 部 分 : 


/* hangup, generated when terminal disconnects «/ 

/* interrupt generated from terminal special char «/ 
/x (x ) quit, generated from terminal special char «/ 
/* Cw) illegal instruction (not reset when caught) «/ 
/* (* ) trace trap (not reget when caught) «/ 

/* ( 4 ) abort process «/ 

/x ( * ) EMT instruction x/ 

/* (x ) floating point exception «/ 

/* kill (cannot be caught or ignored) «/ 


d define SIGBUS 10 /* ( &) bus error (specification exception) «/ 
H define SIGSEGV 1) /x (x ) segmentation violation «/ 

i define SIGSYS 12 /w# ( * ) bad argument to system call s/ 

# define SIGPIPE 13  /» write ou a pipe with no one to read ir «/ 

H define SIGALRM 14 /* alarm clock timeout */ 

# define SIGTERM 15 /x software termination signal +/ 


例如 ,中断 信 号 被 称 为 SIGINT, iB 1B fi S RAW SIGQUIT dE TE BE TE Hc fi 9 E 


SIGSEGV。 任 何 一 个 版 本 的 Unix 的 手册 都 包含 更 多 的 相关 信息 .在 Linux 中 ,可 以 查看 
signal(7) 的 相关 联机 帮助 。 

信和 号 做 什么 ? 这 要 视 人 情况 而 定 。 很 多 信和 号 杀 死 进程 、 某 时 刻 进程 还 在 运行 ,下 一 秘 它 
就 消亡 了 :从 内 存 中 被 而 除 . 相 应 的 所 有 的 文件 描述 符 被 关闭 .并 旦 从 进程 表 中 被 删除 。 使 
用 SIGINT 消灭 一 个 进程 ,但 是 进程 也 有 办 法 保护 自己 不 被 杀 死 。 
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6.4.3 进程 该 如 何 处 理 傅 号 


当 进 程 接收 到 SIGINT 时 ,并 不 一 定 非 要 消亡 。 进 程 能 够 通过 系统 调用 signal 告诉 内 
核 , 它 要 如 何 处 理 信 号 。 进 程 有 3 个 选择 。 

C1) 接受 默认 人 处理 (通常 是 消亡》 

于 其 上 列 出 了 对 每 个 信号 的 默认 处 理 。SIGINT 的 默认 处 理 是 消亡 。 进 程 并 不 一 定 要 
使 用 signal 接受 默认 处 理 , 但 是 进程 能 够 通过 以 下 调用 来 恢复 默认 处 理 : 


signal (SIGINT, SIG DFL); 


(2) 忽略 信号 
程序 可 以 通过 以 下 调 几 来 告诉 内 核 , 它 需要 忽略 SIGINT fae: 


signal (SIGINT, S1G IGN); 


(3) FA — + RC 

第 3 种 选择 是 3 个 当中 最 强大 的 一 种 。 考 虑 play_again3 这 个 例子 。 当 用 户 输入 Ctrl- 
C, 当 前 运行 的 程序 立即 退 电 ,而 不 调用 恢复 驱动 程序 设置 的 效 数 。 更 好 的 做 法 是 ,程序 在 接 
收 到 SIGINT 后 ,调用 一 个 恢复 设置 的 函数 ,然后 再 退出 。 

调用 signal 的 第 3 种 选择 允许 这 种 类 型 的 响应 。 程 序 能 够 告诉 内 惊 . 当 信 生 到 来 时 应 该 
ATOR PRAE. 在 信和 号 到 来 时 被 调用 的 画 数 被 称 为 信号 处 理 函 数 。 为 安装 信号 处 理 国 数 ， 
程序 调用 : 


signal (signum, functionname); 





























signal 
目标 简单 的 信号 处 理 
头 文件 dt include «signal, hz» 
函数 原型 result = signal (int signum, void ( * action) Cint)); 
signum 需 响 应 的 信号 
参数 action QO far nay i 
-1 调 到 错误 


prevaction ”成 功 返 还 


调用 signal 为 编码 是 signum 的 信号 安装 新 的 信号 处 理 函 数 。actiou 可 以 是 函数 名 或 以 
下 两 个 特殊 值 之 一 。 

* SIG_IGN, Zi Fa 

* SIG DEL, FAA SRE ARAM, 

signal 返回 前 + ab Fee. (FLAETE I) es P £L. 
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6.4.4 信号 处 理 的 例子 


L 44845 > 


/x sigdemol,c ~ shows how a signal handler works. 


x — run this and press Ctrl-C a few times 


# include <stdio.h> 
# include <signal. h> 


main() 
{ 
void Flint); /* declare the handler x/ 
int 1; 
signal( SIGINT, f ); /* install the bandler »/ 
for (i90; i<t5;i++){ /* do something else «/ 
printf("hello\n") ; 
sleep(1); 
) 
void f(int signum) /* this function is called «/ 


( 
printf( "OUCH! Mn"), 
} 


主 函 数 由 两 部 分 组 成 .调用 signal 后 进 人 一 个 循环 .sigdemol,. c 调用 signal KR Tt 
SIGINT 的 处 理 函 数 {。 如 果 进 程 接收 到 SIGINT 信号, 内核 会 调用 函数 f 来 处 理 这 个 信号 。 
程序 跳 转 到 那个 函数 ,执行 它 的 代码 ,然后 返回 到 跳 转 前 的 位 置 ,就 像 子 过 程 调 用 一 样 ， 

6.8 显示 了 两 个 独立 的 控制 流 : 一 个 是 正常 的 路 径 , 进 入 main, 执 行 循环 .然后 从 
main 返回 ， 另 一 个 是 由 信号 引起 的 路 径 , 进 入 上 .然后 返回 。 

SIGINT 的 到 达 将 控制 流转 向 信号 


处 理 器 从 信号 处 理 嚣 返回 后 继续 
| 一 正常 榨 制 流 执行 原来 的 控制 流 。 





信号 处 理 流 程 





6.8 入 号 引起 子 过 程 的 调用 
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以 下 是 程序 运行 情况 ， 
$ . /sigdenmol 
hello 
hello press Ctrl - C now 
OUCH! 
hello press Ctrl - € now 
OUCH! 
hello 
hello 
$ 
试 编译 并 运行 这 个 名 序 。 程 序 中 没有 对 『「 的 显 式 调用 。 接 受到 的 信和 地 引 发 了 对 那个 识 
数 的 洞 用 。 
2. 息 略 信号 
/* sigdemo2.c — shows how to ignore a signal 
» - press Ctr] - V Eo kill th: s one 
x/ 


H include <stdio.h> 
H include «signal.h 


main() 
{ 
signal( SIGINT, SIG IGN); 
printf( "you can't stop me! \n"); 
while( 1) 
i 
sleep(1); 
printf “haha\n") ; 


} 


sigdemo2. c 调用 signal 来 设置 为 忽略 中 断 信 号 。 可 以 随意 的 护 Curl 7 C 而 不 会 对 进程 
产生 影响 。 
signal(SIGJNT，SIG_IGN) 的 效果 如 图 6. 9 所 示 。 


进程 告诉 内 核 需要 忽略 SIGINT —— pp 


sigdemo2 





EN 


6.9 signal (SIGINT. SIG_IGN) 8979 # 
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以 下 是 程序 的 运行 情况 : 


$ ./sigdemo2 


you can't stop mel 


haha 
haha 


haha press Ctrl - C now 


haha press Ctrl- C nowpress Ctrl - C now 


haha 
haha 


haha press *\now 


Quit 
$ 


按键 组 合 Ctri-\ 会 发 送 -- 个 不 同 的 信和 号 , 即 quit fii m RBA Bm ok d fx 


SIGQUIT. 


6.5 为 处 理 信 号 做 准备 : play_again4. c 


现在 已 经 知道 如 何 修 改 play_again3.c 来 处 理 信 号 , 们 是 还 需要 做 一 个 设计 决策 。 需 要 
忽略 信号 并 证 用 户 回答 yes 或 no R8? BHR ARE? 当 用 户 输入 no 时 ,要 直接 退出 还 
是 先 返 回 一 个 值 表 示 程 序 已 经 消亡 ? 

下 面 这 个 程序 版 本 捕捉 SIGINT, 重 置 驱动 程序 ,然后 返回 no 的 代码 ， 


/* play again4.c 


* purpose; ask if user wants another transaction 


* method; set tty into chr - by - chr, no- echo mode 


* set tty into no- delay mode 
+ read char, return result 
E resets terminal modes on SIGINT, ignores SIGQUIT 


* returns: 0 — yes, 1 27no, 2=>timeout 


* better; reset terminal mode on Interrupt 


xf 

# include 
# include 
# include 
# include 


# include 


# define 
# define 
H define 
# define 


<I stdio. h> 
<termios. h 
xCfentl. h> 
«string, h > 


<< signal, h 


ASK "Do you want another transaction" 
TRIES 3 /* max tries +; 
SLEEPTTME 2 /* time per try «/ 


BEEP putchar( ħa?) /* alert user +, 
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maint ) 


1 


int response; 


void ctrl c handler(int); 


tty mode(0O); 
set cr noecho mode(); 
set nodelay mode(); 


signal( SIGINT, ctr! c handler }; 


signal( SIGQUIT, SIG IGN ); 


response = get response(ASK, TRIES); 


tty_mode(1) - 
return response; 


à 
J 
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/* save current mode */ 

/* set 一 icanon, ~ echo sy 
/* noinput =>> EOF x, 

¿x handle INT +; 

/* ignore QUIT signals »/ 
/« get some answer x/ 


/* reset orig mode «/ 


get response( char * question , int maxtries) 


H 
p* 


* purpose; ask a question and wait for a y/n answer or timeout 


* method: use getchar and complain about non ~ y/n input 


+ returns: 0 =>> yes, 1=>no 


E 


*j 


int input; 


printf("% s (y/n)?" 
fflush(stdout); 
while ( 1 >i 

sleepi SLEEPTIME) ; 


L4 


input = tolower(get ok char()); 


if (input == ‘yr ) 
return Q; 

if ( input == 'n') 
return l; 

if ( maxtries-- == 0) 
return 2; 


BEEP; 


: 


/* 


question); 


/* ask x 


/* force output x/ 


/* wait à bit «/ 


/* get next chr a/ 


/* outatime? x/ 


/* Sayso */ 


* skip over non— legal chars and return y,Y,n,N or EOF 


#f 
get_ok_char() 


i 


int c; 


while( ( c = getchar() ) t= EOF && strchr("yYnN".c) == NULL ) 


4 
上 
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return €; 
} 
Set cr noecho mode(? 
/x 
* purpose; put file descriptor 0 into chr - by- chr mode and noecho mode 
* method: use bits in termios 
/ 


Eu 


{ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr, setting «/ 
ttystate.c lflag &= 一 ICANON， /* tio buffering x/ 
ttystate.c_lflag &= --ECHO. /* no echo either */ 
ttystate.c_cc[VMIN| = 1; /* get 1 char at a time xy 


tcsetattr( 0 , TCSANOW, &ttystate) ; /* install settings «/ 
1 
set podelay modet) 
fs 
* purpose: put file descriptor 0 into no- delay mode 
* method; use Font] to set bits 
* notes: tcsetattr() will do something similar, but it is complicated 
x6 
{ 


int termflags; 


termflags = fcntl(0, F_GETFL); ¿+ read curr. settings x/ 
termfiags | = O NDELAY; /* flip on nodelay bit «/ 
fcntltO, F SETFL, termflags); /* and install ‘em x/ 
} 
/* how == Q — save current mode, how == 1 => restore mode x/ 
/* this version handles termios and fontl flags wf 


tty mode(int how) 

{ 
Static struct termios original, mode; 
static int original flags; 


static int stored = 0; 


r 


if ( how == 0| 
tegetattr(0, Eoriginal mode); 
original flags = fcntl(0, F_GETFL); 
stored - 1; 
} 
else if ( stored ) | 
tesetattr(0, TCSANOW, &original mode); 


fcntl( 0, F SETFL, original flags); 
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上 


void ctrl c handler(int signum? 

fx 
* purpose; called if SIGINT is detected 
* action; reset tty and scram 
x / 


1 
i 


tty modetl1): 
exit( 1} 1 


其 他 的 设计 贸 作 练习 。 
6.6 进程 终止 


程序 使 用 signal 来 告 沂 内 核 它 需 要 忽略 哪些 信 上 号。 如果 有 人 编写 了 一 个 将 所 有 类 型 的 
Asi BA SIG_IGN 的 程序 , 然 厂 执行 一 个 无 限 循 环 将 会 如 何 呢 ? 

幸好 ,对 系统 管理 员 ( 和 程序 员 ) 来 说 ,Unix 不 可 能 让 一 个 程序 永 椒 停止 。 有 两 个 信和 号 是 
不 能 被 忽略 和 捕 扣 的 。 阅 读 于 册 或 头 文件 中 的 信号 列表 ,看 看 哪些 信号 是 不可 阴 挡 的 。 


6.7 为 设备 编程 


现在 已 经 了解 了 编写 终端 控制 程序 的 三 个 方面 .首先 ,学 习 了 驱动 程序 的 属性 和 如 何 
控制 连接 。 然 后 ,学 习 了 应 用 程序 的 特定 需求 ,并 调整 台 动 程序 以 满足 这 些 需求 。 最 后 ,学 
习 了 如 何 处 理 信 号 … 中 断 的 一 种 形式 . 

这 二 个 方面 对 所 丰 的 设备 都 适用 。 考 虑 一 块 声 卡 或 -个 磁盘 驱动 程序 。 设 备 有 许多 种 
出 设备 驱动 程序 控制 的 没 置 , 需要 了 解 这 些 设置 。 同 祥 ,程序 必须 实现 特定 的 功能 ,调整 驱 
动 程 序 以 满足 这 些 需求 。 最 后 ,很 多 设 符 驱动 程序 会 产生 信号 报告 错误 或 特定 事件 。 伐 级 
驱动 程序 可 能 在 它 结 束 从 磁盘 到 内 存 数 据 块 的 复制 时 发 送 一 个 信号 ,程序 必须 能 够 对 这 些 
信号 做 出 响应 。 











小 zh 


1. ERAS 

* 有 些 程序 处 理 从 特定 设备 来 的 数据 。 这 些 与 特定 设备 相关 的 程序 必须 控制 与 设备 的 
HEE, Unix 系统 中 最 常见 的 没 备 是 终端 。 
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据 , 它 们 从 驱动 程序 传输 到 程序 。 有 些 键 调用 驱动 程序 中 的 编辑 函数 ,如 果 按 下 删 
除 键 , 驱动 程序 将 前 一 个 字符 从 它 的 行 缓冲 中 删除 ,并 将 命令 发 送 到 终端 屏幕 ,使 之 
从 显示 器 中 删除 字符 。 最 后 ,有 些 链 调 用 处 理 控制 沙 数 。Ctrl LC 键 告诉 驱动 程序 调 
用 内 核 中 茶 个 函数 ,这 个 函数 给 进程 发 送 一 个 信和 号。 终端 驱 动 程序 支持 若 于 种 处 理 
控制 函数 ,它们 都 通过 发 送信 号 到 进程 来 实现 控制 。 
* 信号 是 从 内 核发 送 给 进程 的 一 种 简短 消息 。 信 和 号 可 能 来 提出 户 . 其 他 进程 或 内 核 本 
身 。 进 程 可 以 告诉 内 核 ,在 它 收 到 信和 号 时 需要 向 出 怎样 的 响应 。 
2. 进一步 的 问题 
Unix 系统 总 是 从 很 多 终端 或 其 他 设备 接收 数据 。 用 户 可 能 在 任何 时 刻 输 入 数据 ,内 核 
必须 处 理 这 些 输 入 。Unix 系统 同时 运行 车 十 个 程序 。 内 核 如 何在 同一 时 刻 维护 多 个 并 发 的 
任务 并 对 多 个 不 可 预知 的 中 断 作 出 响应 呢 ? 下 一 章 将 通过 编写 一 个 计算 机 游戏 程序 米 探讨 


这 个 问题 。 
习题 


3. 
6.1 


6.2 


很 多 Unix 软件 工具 从 命令 行 指 定 的 文件 中 读 皮 数据 。 命令 tr 不 是 这 样 。tr 是 用 
来 干什么 的 ? 能 想 出 它 不 接受 命令 行 指定 文件 名 的 原因 吗 ? 还 有 其 他 仪 从 标准 
输 人 读 取 数据 而 不 从 指定 的 文件 中 读 取 数据 的 Unix 工具 吗 ? 大 多 数 的 Unix 命 
令 存 情 在 /bin、”usrybin fRl/usr/local/bin ASF. 


任何 文件 描述 符 都 有 O NDELAY 这 个 属性 ,而 不 仅仅 是 终端 葬 动 程序 的 属 忻 。 
这 意味 着 这 个 属性 适用 于 磁盘 文件 ,也 适用 于 设备 文件 。 

对 磁盘 文件 来 说 , 非 阻塞 性 意味 着 什么 ?除了 终端 文件 , 非 阻塞 性 对 设备 意味 着 
什么 ? 


4. 编程 练习 


6. 3 


6.4 


文件 摘 述 符 可 能 处 于 阻塞 或 无 延迟 ( 即 非 阻 寨 ) 模 式 。 终 端 驱 动 程序 提供 了 其 他 
选择 , 它 介 许 对 输入 设置 超时 间隔 。 驱 动 程序 termios 结构 体 中 的 控制 字符 数组 c 
_cc[ 在 位 置 VTIME 的 元 素 是 用 来 设置 以 毫秒 为 单位 的 超时 间隔 。 因 此 ,s.c_ee 
LVTIME] = 20 会 将 驱动 程序 的 超时 设置 为 2 s。 

改写 play_again3. c, 使 得 它 使 用 驱动 程序 中 的 超时 特征 ,而 木 再 将 文件 描述 符 置 
于 非 阻塞 模式 。 


在 play again 中 处 理 信 号 。 

(1) 修改 play again3. c, 使 得 它 忽略 键盘 信号 ,而 仅 对 yes 或 no 做 出 响应 

(2) 修改 play_again3. c, 使 得 它 在 收 到 键盘 信号 后 ， HE eR YELL EUN 2 退 
th 


修改 rotate. c, 使 得 它 能 够 改变 tty 的 模式 。 修 改过 的 程序 应 该 关闭 规范 模式 ,并 
且 关 闭 回 显 。 然 后 它 读 取 字符 并 显示 字母 表 中 的 下 一 个 字母 。 当 用 户 按 下 字母 
“Q" 时 ,程序 应 该 恢复 tty 设置 并 退出 ， 

你 的 程序 应 该 忽略 键盘 信号 或 通过 在 进出 之 前 重 和 驱动 程序 来 对 它们 进行 处 理 ， 
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编写 一 个 行 编辑 器 。 编 写 运 行 在 非 规范 模式 程序 的 一 个 问题 是 缺乏 输入 编辑 
修改 纠正 过 的 rotate. c, 使 之 支持 字符 和 行 编辑 。 特 别 地 , 当 程 序 收 到 一 个 退 格 或 
删除 字符 时 , 它 从 屏 划 上 删除 前 一 个 字符 。 为 删除 一 个 字符 ,程序 需 芝 打印 一 个 
退 格 字符 .一 个 空格 字符 ,然后 又 一 个 退 格 字符 。 

同时 ,修改 程序 ,使 得 它 能 够 像 终 端 驱动 程序 那样 处 理 行 删除 字符 。 也 就 是 ,从 屏 
幕 上 册 除 当前 输入 行 的 所 有 字符 。 

需要 做 什么 以 实现 驱动 程序 的 单词 删除 功能 呢 ? 


修改 程序 sigdemol. e, 使 得 它 能 够 对 用 户 按 下 的 Ctrl -C 个 数 进行 计数 。 人 和 修改 过 
的 程序 将 显示 OUCH! A OUCH! !, , 即 感叹 导 的 个 数 和 处 理 函 数 被 调用 的 次 数 
相等 。 

除了 显示 递增 的 感叹 号 ,程序 应 该 能 够 接受 一 个 整数 作为 命令 行 参 数 。 在 用 户 按 
下 Ctrl-C EHE SS BRAS ZI ,程序 应 该 退出 。 


修改 程序 sigdemol. c, 使 得 它 能 够 询问 用 户 是 否 真 的 要 终止 程序 。 运 行 的 样 例如 
下 所 示 ， 

hello 

hello 





Interrupted! OK to quit (y/n)? n 
hello 
hello 
Interrupted! OK to quit (y/n)? y 
$ 
如 果 当 程序 在 等 待 用 户 回答 OK to quit (y/n)? W HP FE FP Ctrl CERE 
生 什么 事 ? 实现 上 述 程 序 ,并 观察 发 生 的 现象 。 


程序 能 够 使 用 signal 告诉 内 核 它 需要 忽略 特定 的 信号 , 像 SIGINT 和 SIGQUIT, 
5j :种 不 同 的 方法 是 一 开始 就 福 绝 这 些 信号 的 产生 。 终 端 驱动 程序 有 一 个 称 为 
ISIG 的 标志 。 阅 读 手 册 , 以 了 解 这 个 标志 的 用 途 。 然 后 使 用 这 个 标志 重 写 
sigdemo2. c, 

当 修 改过 的 程序 接收 到 从 键盘 以 外 的 地 方 发 送 来 的 SIGINT 信号 时 ,程序 将 做 什 
A? 学习 命令 kill, 并 使 用 kill 发 送 SIGINT 到 关闭 了 ISIG 的 那个 版 本 的 程序 。 


中 断 并 不 总 是 破坏 性 的 。 想 象 你 正在 做 一 个 需要 若干 天 的 项 目 。 你 吓 能 收 到 老 
板 询问 工作 进展 的 电话 。 这 些 中 断 是 用 来 调用 状态 报 等 的 子 程序 的 ,而 不 是 用 
来 杀 死 进程 、 编写 一 个 执行 耗 时 任务 的 C 程序。 例如 ,编写 一 个 使 用 较 慢 的 方 
法 寻找 素数 的 程序 。 程 序 需要 跟踪 它 到 目前 为 止 所 找到 的 最 大 的 素数 。 实 现 一 
个 SIGINT 的 处 理 器 函数 ,这 个 绪 数 用 来 显示 它 所 找到 的 素数 的 个 数 以 及 素数 的 
最 大 值 。 

这 个 想法 如 何 运用 在 系统 编程 中 ? 
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6.11 


6.12 


在 第 1 章 中 ,实现 了 几 个 版 本 的 more。 那 时 并 不 知道 如 何 控制 终端 驱动 程序 ， 
改进 那个 程序 ,使 它 运行 无 回 显 . 非 规 范 模式 中 ,并 能 对 中 断 和 终止 信和 号 做 出 正 
确 的 响应 。 


用 户 不 仅 能 够 通过 按键 产生 信号 ,也 能 通过 改变 终端 窗口 的 大 小 产生 信号 。 窗 
口 每 次 改变 大 小 时 ,SIGWINCH 就 被 发 送 到 进程 。 按 默认 处 理 , 进 程 将 忽略 
SIGWINCH 信和 号。 编写 一 个 程序 ,使 得 能 够 在 屏幕 上 打印 满 屏 的 字母 “A”。 例 
如 ,如 果 窗 口 有 10 行 20 列 , 程 序 要 显示 字母 “A”200 次 。 当 窗口 大 小 改变 时 , 程 
序 用 字母 “B” 填 充 整 个 屏幕 。 下 一 次 ,使 用 “C” ,以 此 类 推 。 当 用 户 按 下 字母 “Q” 
时 ,屏幕 清除 ,程序 退出 。 当 用 户 按 下 其 他 任何 键 时 ,屏幕 从 字母 "A"* 重 新 开始 。 
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概念 与 技巧 

， Ha RE 

。 curses 库 : 目标 和 使 用 
。 警告 和 间隔 计时 器 

。 可 人 靠 的 信号 处 理 

。 可 重信 代码 .临界 区 

。 异步 输入 

相关 的 系统 调用 和 函数 

* alarm, setitimer, getitimer 
* kill. pause 

* sigaction,sigprocmask 


* fentl, aio read 


7.1. 视频 游戏 和 操作 系统 


贝尔 实验 室 的 Dennise Ritchie 和 Ken Thompson A T 5i— A n f E BRAR AT 2 En] 2 DE 
a, PEAS D Unix. Ritchie Bik: 
Thompson 在 1969 年 就 开发 了 4 星际 艾 行 y》 这 个 游戏 。 第 一 次 是 在 Multics 操作 系统 上 ,然后 用 Fortran 
移植 到 GECOS(GGE 上 运行 的 -个 操作 系统 ,后 来 在 Honeywell 635 bgt) 。 那 是 一 个 由 玩家 在 模拟 的 移 
动 太阳 系 中 ,根据 屏幕 上 显现 的 环境 引导 飞船 在 不 同 的 行星 或 卫星 上 降落 的 游戏 。GECOS 上 的 这 个 版 本 
在 两 个 重要 方面 并 不 令 人 满意 : 第 一 ,游戏 的 显示 有 些 不 连贯 ,同时 通过 敲 击 命令 来 控制 很 难 沿 握 ;第 二 , 游 
戏 需 要 在 一 人 台 太 卉 机 上 大 约 花 费 75 美元 的 CPU 时 间 来 运行 。 所 以 不 入 以 后 ,Thompson 找到 一 台 很 少 使 
用 的 PDP-7 it RL. AALS ARE BAR. BP RA AIR Graphic ll 的 终端 。 他 和 我 重 写 了 K 星 
际 旅 行 }? 使 之 能 运行 在 这 台 机 器 上 。 实 际 上 , 趴 正 的 目标 比 看 土 去 更 加 雄心 勃勃 。 因 为 我 们 抛弃 了 所 有 现 
存 的 软件 ,所 以 不 得 不 宇 -- 个 浮 点 运算 包 ,显示 特性 的 点 序 规格 说 明 , 以 及 -- 个 在 屏幕 角 上 连续 显示 输入 内 
AMWHE TRS. 所 有 这 些 都 县 用 汇编 语言 写 的 ,用 - :个 在 GECOS KAA XOT H2 RR GT PDP-7 的 纸 
带 上 。 
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是 际 旅行 3 尽管 是 一 个 非常 吸引 人 的 游戏 ,但 也 只 是 主要 作为 学 习 复 杂 的 PDP? BRT RB RE. 
不 入 以 后 Thompson 开始 实现 一 个 之 前 就 已 设计 好 的 纸 带 文件 系统 (paper file system) (或 者 说 粉笔 文件 系 
统 即 chalk (ile system 更 加 合适 )。 在 没有 练 刁 的 情况 下 试图 建立 一 个 文件 系统 是 非常 困难 的 ,所 以 他 继续 
以 - :个 每 用 拘 作 系统 的 其 他 功能 来 充实 自己 的 系统 ,尤其 是 进程 的 概念 。 然 后 是 小 部 分 用 户 级 的 工具 : 
复制 .打印 .删除 和 编辑 文件 的 工具 。 当 然 还 有 一 个 简单 的 命令 解释 器 (sheliy。 直 到 此 时 所 有 的 程序 还 是 
在 GECOS 上 写 的 ,然后 用 纸 旧 转移 到 PDP-7 上 ,但 是 一 二 有 一 个 自己 的 汇编 器 它 就 是 以 支持 和 白 己 了 。 尽管 
真 到 1970 年 Brian Kernighan 才 建 议 使 用 Unix RARE FA AR Multics 的 双关 辣 ) 来 命名 系统 ,如 今 所 
知 这 个 操作 系统 已 经 诞生 了 .。 . 

视频 游戏 和 操作 系统 有 很 多 共同 点 。 在 本 章 中 将 完成 -个 简单 的 视频 游戏 。 通 过 这 个 
合子 来 介绍 更 多 的 Unix 系统 服务 、 一 些 基 本 原则 和 操作 系统 设计 技术 。 

l. 视频 游戏 做 什么 

考 虐 一 个 有 沽 个 人 参与 的 星际 旅行 视频 游戏 。 程 序 创立 行星 ,流星 ,飞船 和 其 他 物体 的 
影像 ,并 司 它 们 移动 。 待 一 个 物体 有 白 己 的 移动 速度 .方向 、 动力 和 其 他 一 些 属 性 。 物体 之 
问 衬 立 作 用 。 一 个 流星 可 能 撞 上 飞船 或 其 他 流星 。 

游戏 同时 要 响应 用 户 町 入 。 游 戏 玩 家 们 道 过 按钮 .鼠标 利 轨 和 迹 球 在 任何 时 刻 部 有 可 能 
生成 输入 ,各 序 必须 在 很 短 的 时 间 里 作出 响应 。 这 些 输入 事件 会 影响 游戏 中 物体 的 属性 。 
通过 按 下 按 饥 , 用 户 可 以 增加 飞船 速度 或 是 减少 飞船 质量 。 飞 船 的 变化 会 影响 它 与 其 他 物 
体 的 作用 方式 。 

Z. 视频 游戏 如 何 做 

一 个 视频 游戏 综合 了 一 些 基本 的 概念 各 原则 。 

C1) 7 [8] 

ROA ET PLE SE EER. BRP Pr hu 

(2) 时 间 

影像 以 不 同 的 速度 在 屏 送 上 移动 。 以 - :个 特定 的 时 间 间 隔 改 变 位 置 。 程 序 足 如 和 何 蓝 知 
时 间 并 且 人 在 特定 的 时 间 安 排 事 情 的 发 生 ? l 

(3) 中 期 

程序 在 屏幕 上 平 请 的 移动 物体 ,用 户 可 在 任意 时 刻 产 生 输 人。 程序 是 如 何 响应 中 断 的 ? 

(4) 同时 做 几 件 事 

游戏 必须 在 保持 几 个 物体 移动 的 同时 还 要 响 应 中 断 。 程 序 是 如 何 同时 做 多 件 事 情 而 不 
FEAT BE KE m AY? 

3. 操作 系统 面 将 类 似 的 问题 

操作 系统 同样 要 击 对 这 4 个 问题 。 内 核 将 程序 载 人 内 存 空间 并 维护 每 个 程序 在 内 存 中 
所 处 的 位 置 。 在 内 核 的 调度 下 ,程序 以 时 间 片 间 甩 的 方式 运行 ,同时 ,内 核 也 在 特定 的 时 刻 
运行 特定 的 内 部 任务 。 内 核 必须 在 很 短 的 时 间 内 响应 用 户 和 外 设 在 任何 时 刻 的 输入 。 同 时 
做 几 侍 事情 需要 一 些 技巧 。 内 核 是 好 何 保证 数据 的 有 序 和 规整 的 ? 

4. 屏 莫 管理、 时间、 信号、 共享 资源 

本 章 将 学 二 屏幕 管理 ,时间 ,信号 和 如 何 安全 地 同时 做 元 件 事 情 。 为 了 学 习 这 4 个 基本 
主题 ,将 编写 一 个 基于 字符 终端 的 动画 游戏 。 

为 什么 是 基于 字符 的 图 形 翼 面 ? 
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为 什么 不 用 强大 的 X11 来 编程 或 者 是 java 来 给 图? 这 早 有 很 多 原因 。 首 先 , 基 于 字符 
的 游戏 除了 每 个 像素 大 些 外 ,其 他 与 高 分 辩 率 的 图 形 界面 游戏 非常 相似 。 其 次 是 可 移植 性 。 
字符 图 形 界面 游戏 只 需要 -个 终端 模拟 器 和 一 个 连接 ,这 些 是 每 个 系统 都 提供 的 。 第 一 ,在 
绘图 上 省 下 来 的 时 间 可 以 用 在 系统 编程 上 。 尽 管 如 此 ,如 果 喜 欢 更 好 的 图 形 界面 ,网 站 上 有 
这 个 游戏 的 X Windows RA, 


7.2 任务 : 单 人 弹 球 游戏 (Pong) 


现在 开始 了 了 。 本 章 的 主要 任务 是 实现 一 个 在 游戏 房 和 家 庭 中 常见 的 经 典 游戏 一 AR 
游戏 。 图 ?. 1 显示 了 它 的 3 个 主要 元 素 : 墙 , 球 和 挡 板 。 游 戏 的 窒 要 描述 如 下 ， 

OD 球 以 一 定 的 速度 移动 ; 

(2) 球 碰 到 墙壁 或 挡 板 会 被 弹 回 ， 

CD 用 户 按 按钮 来 控制 挡 板 上 下 移动 ， 


| 
| | 一 bil. 用户 控 制 
| 一 球 : RR LAGER 
| Hh 不 让 球 飞 出 去 
tis EH J 


图 7.1 单 人 视频 游戏 














写 这 个 游戏 需要 了 解 如 何 管理 屏幕 ,时 间 和 中 断 ,还 要 理解 如 何 安 全 地 同时 做 儿 件 事 
情 。 下 面 一 样 一 样 来 学 。 


7.3 有 屏幕 编程 : curses 库 


curses 库 是 一 组 函数 ,程序 员 可 以 用 它们 来 设置 光标 的 位 置 和 终端 屏幕 上 显示 的 字符 样 
A. curses FRUER UCB 的 开发 小 组 开发 的 。 大 部 分 控制 终端 屏幕 的 程序 使 用 curses, 
曾经 由 一 组 简单 的 函 煞 组 成 的 库 现 在 包括 了 许多 复杂 的 特性 。 这 里 将 使 用 其 中 很 少 一 部 分 
的 功能 。 


7.3.1 介绍 curses 


curses 将 终端 屏幕 看 成 是 由 字符 单元 组 成 的 网 宪 , 每 一 个 单元 由 ( 行 、 列 ) 坐 标 对 标示 。 
堂 标 系 的 原点 是 屏幕 的 左上 角 , 行 坐标 自 上 而 下 递增 , 列 坐 标 自 左 向 右 递增 ，。 7.2 ER T 
curses 屏幕 。 

curses 具有 的 蝎 数 包括 可 以 将 光标 移动 到 屏幕 护 任 何 行 、 列 单元 , 添 可 字符 到 屏幕 或 者 
从 屏幕 上 删除 字符 ,设置 字符 的 可 视 属 性 (如 颜色 .亮度 ), 建 立 和 控制 窗口 以 及 其 他 文本 区 
域 。 用 户 手册 有 curses 的 所 月 数 的 详细 描述 。 这 里 将 用 到 其 中 的 3 个 。 













move (5,9); 
addstr ("nheilo") 

















initscr(? 
endwin() 
refresht) 
movetr,c) 
addstr(s) 
addch(c) 
cleat() 
standout() 


standend{ } 


curses 例 1; hellol.c 
第 一 段 程序 展示 了 一 个 curses FRE ES EB 


/x hellol.c 



































fl 7.2 curese RG EY BS 


基本 curses 函数 





TAE curses E FI uy 

关闭 curses HEE tty 

(8 BE BE c FR MS ET 

移动 光标 到 屏幕 的 (r,c) 位 置 

TE Bü fr BRS AR s 

TE SÁRU fir BF c 

T BE 

启动 standout 模式 (一 般 合 屏幕 反 色 } 
关闭 standout 模式 


x purpose 
* outline 


xf 


d include <istdio. h> 


“include «curses, h> 


maint) 
f 


initser() ; 


clear(}; 
move(10,205; 


addstr("Hello, world"); 


move(LINES- 1,0); 
refresh(> ; 


getch); 


show the minimal calls needed to use curses 


initialize, draw stuff, wait for input, quit 


/* turn on cursesx/ 
/* send requests «/ 
/* clear screen x/ 
/* rowl10,col20 x/ 
/* add a string x/ 
/* move to TL «/ 


/* update the screen «/ 


/* wait for user input «/ 
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enduin(); fx turn off curses x/ 


编译 和 运行 程序 非常 简单 : 


$ ec hellol.c - 1 curses - o hellel 
è .fhelloi 


— R 


输出 如 图 7.3 Bras. iX REAR EE SE Unix 系统 的 任何 终端 上 都 能 运行 。 


Hello, World 





BE 7.3 第 一 个 基于 curses 的 程序 


curses 例 2. hello2. c 
将 curses 图 数 与 循环 .变量 和 其 他 函数 组 合 在 一 起 会 产 千 更 复杂 的 显示 亦 果 。 预 测 以 


下 第 2 个 例子 的 输出 : 


/* helio2.c 
* purpose show how to use curses functions with a loop 
* outline initialize, draw stuff, wrap up 


x, 


# include <(stdio. h> 


df include  «curses. h> 


main) 

{ 
int i; 
initser(); /* turn on curses x/ 
clear(); /* draw some stuff «/ 
for(iz0; i-—LINES; i++ }j /* ina loop */ 


move( i, iti); 

if ( i$2 == 1) 
standout() ; 

addstr( "Hello, world"); 

if (1i%2 == 1) 
standend(); 
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refresh(); /+ update the screen */ 
getcht); /x wait for user inputs / 
enduin(); /x reset the tty erc «/ 


! 
fvk3XReTrU. WR I HERS? 
7.3.2 curses 内 部 : 虚拟 和 实际 屏幕 


refresh 函数 做 了 些 什么 ?试验 -下 : ERMA, BAS. CTE. ÁREA 
没有 出 现在 屏幕 上 ， 

curses 设计 成 为 能 够 在 不 阻塞 通信 线路 的 情况 下 更 新 文本 屏幕 。curses illl ct IR LUC 
(如 图 7. 4 所 示 ) 来 最 小 化 数据 流 证 、 


addstr 写 人 屏幕 缓存 BEA 
真实 屏幕 


= 





refesh TP AEIR W 
图 7.4 Curses 保持 真实 屏幕 的 副本 


真实 屏幕 是 眼前 的 一 个 字符 数组 。curses 保留 了 屏幕 的 两 个 内 部 版 本 。 一 个 内 部 屏幕 
是 真实 屏幕 的 复制 。 另 一 个 是 工作 屏幕 ,其 上 记录 了 对 屏幕 的 改动 。 每 个 并 数 ,比如 move, 
addstr 等 都 只 在 工作 屏幕 上 进行 修改 。 工 作 屏 幕 就 像 磁盘 缓存 ,curses 中 的 大 部 分 的 函数 者 
只 对 它 进 行 修改 ， 

refresh MWR T. E BE RECRU ELSE RRM SH. BIG refresh 通过 终端 驱动 送出 那些 能 
使 真实 屏幕 与 工作 屏幕 一 致 的 字符 和 控制 中 例如 ,如 果真 实 屏 幕 的 左上 角 是 Smith, 
James, 48 fa FJ addstr 把 Smith Jane 放 在 相同 的 位 置 , 调 用 refresh 也 许 只 是 用 n 和 空格 替换 
了 James 中 的 m 和 s。 这 种 只 传输 改变 的 内 容 而 不 是 影像 本 身 的 技术 被 用 在 视频 流 中 。 


7.4 时 钟 编程 : sleep 


为 了 瑟 一 个 视频 游戏 ,需要 把 影像 在 特定 的 时 间 置 于 特定 的 位 置 。 用 curses PEAR 
于 特定 的 位 置 。 然 后 在 程 庄 中 添加 时 间 响 应 。 第 1 25 (E FERE CERE sleep. 
BH iff HF 1; hello3, c 


/» hello3.c 


* purpose using refresh and sleep for animated effects 
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* outline initialize, draw stuff, wrap up 
xf 
£ include << stdio. h > 


E include «curses. hz- 


main) 


d 


int i; 
initscr(); 
clear(); 


foríi-0; 


; i< LINES; i++ D) 
move( i, iti); 
if (i%2 == 1} 
standout(); 
addstr("Hello, world"); 
if(iX&2 == 1) 
standend() ; 
sleep( 1); 
refresh(); 
} 
endwint); 


1 
T 


当 编 译 并 运行 这 个 程序 的 时 候 ,将 看 到 hello *£ 8E TE BERE A E ili METER. Pi 
加 一 行 , 反 色 和 正常 显 上 下 交替 出 现 。 为 什么 在 每 次 循环 结 东 都 要 调用 refresh? 如 果 不 这 样 
会 有 什么 效果 ? 

动画 例子 2: hello4. c 


/* hello4.c 
* purpose show how to use erase, time, and draw for animation 
xf 

# include <<stdio. h> 


i include «curses. h> 


maint } 


initser(); 
clear(); 


for(i=06; 


; I<TLINES; i++ }{ 

move( i, iti); 

if (i1%2 == 1) 
standout(); 

addstr("Hello, world"); 


if ( ił? 2-21) 





第 7 章 事件 驱动 编程 : 编写 一 个 视频 游戏 » 187 + 








standendO ; 


refresh(); 
sleep(l); 
move(i,it i); /* move back «/ 
addstr" "y /* erase line */ 
} 
endwin(); 


4 


i 


hello4 创造 移动 的 很 象 . 字符 吕 沿 着 对 角 线 缓慢 向 下 移动 。 秘 诀 是 先 在 一 个 地 六 画 字 
符 串 ,睡眠 1 秒 钟 ,然后 在 原来 的 地 方 茵 空 字符 申 以 删除 原 有 影像 ,最 后 将 输出 位 置 推进 。 注 
意 在 两 次 请 求 之 后 通过 调用 refresh 来 保证 每 次 循环 后 旧 的 影像 消 朱 ,新 的 影像 显示 。 图 
7.5 是 屏幕 的 一 个 快照 . 


~ — 
Hello, world 





图 7.5 APS RR el TES 


TA BET AFB DAE DE IE Ge 
动画 例子 3: hello5.c 


/* hello5.c 

* purpose bounce a message back and forth across the screen 
* compile cc hello5.c ~ icurses - o hello5 
xf 

# include <Ccurses. h> 


# define  LEFTEDGE 10 
# define RIGHTEDGE 30 
#define ROW 10 


main() 

{ 

char message = "Hello"; 
char blank = " r, 
int dir = +1; 

int pos = LEFTEDGE ; 


initscr(; 


clear(: 
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while(1){ 
move( ROW, pos) ; 
addstr( message ); fx draw string */ 
move(LINES—1,COLS- 12; /* park the cursor */ 
refresh(); fsx show string */^ 


&leep(15; 
movet ROW, pos) ; /* erase sLring */ 
addstr( biank ); 
. pos += dir; /* advance position */ 
if ( pos >= RIGHTEDGE ) /* check for bounce +/ 
dir = -1; 
if ( pos <= LEFTEDGE ) 


dir = #1; 
à 


变量 dir 用 来 控制 字符 忠 移 动 的 速度 。 当 dir 是 一 1 时 ,字符 串 每 一 秒 向 右 移 动 一 记 。 
当 dir E — 1 时 ,字符 操 每 秒 向 左 移动 一 列 。 改 变 dir 的 符 吕 就 改变 了 字符 串 移 动 的 方向 。 
图 7.6 是 某 一 特定 时 刻 屏 幕 的 快照 。 





ZEE Helle, world 





BSE PORTS ES 


图 7.6 APR Boe IK 


现在 该 如 何 做 ? 

现 在 离 能 够 写 出 一 个 像样 的 动作 类 视频 游戏 有 多 远 ? 已 经 知道 了 如 何在 屏幕 的 任何 地 
方面 字符 串 ,也 知道 了 如 何 通 过 曾 , 掠 掉 和 重 画 之 间 搬 人 时 延 米 创造 动画 效果 。 迄 今 实现 的 
PIAA. Re: 


(1) 一 种 钟 的 时 延 太 长 LE EE E A a Rit ETAS; 
(20 需要 增加 开户 输入 。 
这 些 问 题 引 出 新 的 话题 : 用 时 钟 和 高 级 信号 编程 。 然 后 ,将 再 次 回 到 这 个 游戏 。 


7.5 时 钟 编程 1: Alarms 


程序 可 以 以 不 同 的 上 方式 使 用 时 钟 。 可 以 用 来 在 执行 流 中 加 和 时 延 。 前 面 的 3 个 例子 里 
用 sleep 加 入 时 延 。 时 钟 的 另 一 个 用 途 是 调度 一 个 将 来 要 做 的 任务 ,就 像 拨 好 一 个 者 鸡蛋 的 
定时 泥 , 然 后 干 别 的 事情 直到 定时 器 鸣叫 。 同 样 的 日 的 ,Unix 提供 alarm, 


第 7 意 事件 驱动 编程 : 编写 一 个 视频 游戏 ”j89 。 








7.5.1 JRLnR]3E: sleep 

DT AJ PS GERE . (fr RH sleep o8 3Y : 

sleep(n) 

sleepin 44 “4 jij DER HEE n be e e BR fel BF Be d HS 9 9 T A. 
7.5.2 sleep() 是 如 何 工作 的 : 使 用 Unix 中 的 Alarms 


sleep EK t f T 4E PUH 5 VR 38 Wie sg I i fur ie — RE 

(1) ENS Bh 5) RAE RE BY EP 3 ; 

(2) MEJE, BEIM P 9 E. 

£j 7. 7 AE ix Ll fp Xe Pu. APH aA — TR ROI SP alarm clock). 
t 4" 8) Bb R 4 — 1 Tr EAR, RTL UE RETE E PP UR IEEE. HAD E] PR AR GE — P fm 
SIGALRM 到 进程。 除非 进程 为 SIGALRM ix Tt T Ab Hi AH Chandler) ,否则 信和 号 将 杀 死 这 
个 进程 。sleep 函数 由 3 22 PEAR: 

l. 为 SIGALRM 设置 一 个 处 理 基数 ， 

2. 润 用 alarm(num_seconds); 


3. WJH pause, 





sleep 省 数 是 如 和 何 工作 的 ， 
signal (SIGALRM, handler) i: 


alarmin), 


| 
| 
| 


pause(); 


B 
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系统 调用 pause 挂 起 进程 直到 信号 到 达 。 任 何 信号 都 可 以 唤醒 进程 ,而 非 仅仅 等 待 
SIGAILRM。 以 上 想法 总 结 为 以 下 代码 : 


/* sleepl.c 
x puxpose show how sleep works 
~ usage sleep] 
* outline sets handler, sets alarm, pauses, then returns 
"/ 
B include <stdio.h> 
d include <signal.h> 
// #define SHHHH 


nain() 


| 
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void wakeup(int) ; 


printf( "about to sleep for 4 seconds\n") ; 


signal (SIGALRM, wakeup) ; j» catch it «/ 
alarm(4); /» set clock #/ 
pause(); '* Freeze here *) 
printf( "Horning so soon? ln"); '* back to work =) 


} 


void wakeup( int signum) 
i 
# ifndef SHHHH 
printf( "Alarm received from kernel\n"); 


= endif 

) 

这 里 调用 signal 设置 SIGALRM 处 理 函 数 . 然 后 调用 alarm 设置 一 个 4 秒 的 计时 器 ,最 
后 调用 pause 等 待 。 

调用 pause 的 目的 是 挂 起 进程 直到 有 一 个 信和 号 被 处 理 。 当 计时 器 计 时 4 秘 锅 以 后 ,内 核 
送出 SIGALRM 给 进程 ,导致 控制 从 pause 距 转 到 信号 处 理 函 数 。 在 信号 处 理 程 序 中 的 代位 
被 执行 ,然后 控制 返回 。 当 信号 菩 处 理 完 后 ,pause 返回 ,进程 继续 。 图 7.8 总 结 了 pause 的 
执行 过 程 ， 


正常 的 控制 流 









pause ( ) 系 统 调用 导致 进 
程 阻塞 直到 信号 被 处 理 


图 7.8 进入 处 理 函 数 的 执行 流 


下 面 是 alarm pause 的 细节 ， 

















alarm 
目标 没 置 发 送信 号 的 计时 器 
AXi # include -一 unistd. h> =o 
函数 原型 unsigned old = alarm(unsigned seconds) 
m 参数 seconds 等 待 的 时 间 〈 秒 ) 
=] 如 果 出 错 


返回 什 old 计时 器 剩余 时 间 
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alarm 设置 本 进程 的 计时 器 到 seconds 秒 后 激发 信和 号。 当 设 定 的 时 间 过 去 之 后 ,内 核发 
送 SIGALRM 到 这 个 进程 。 如 果 计 时 器 已 经 被 设置 ,alarm 返回 剩余 秒 数 ( 注 意 : 调用 alarm 
(0) 意 味 着 关 掉 闹钟 ) 。 























pause 
BRR 等 待 信号 ml 
m 头 文件 r # include << unistd. h> 
函数 原型 result 一 pause() 
参数 没有 参数 
返回 什 总 是 一 


pause 挂 起 调用 进程 直到 一 个 信号 到 达 。 如 果 调 用 进程 被 这 个 信号 终止 ,pause 没有 返 
回 。 如 果 调 用 进程 用 一 个 处 理 芳 数 捕获 ,在 入 制 从 处 理 函数 处 返回 后 pause 返回 。 这 种 情况 
F errno git HA EINTR. 


7.5.3 调度 将 要 发 生 的 动作 


计时 内 的 另 一 个 用 途 是 调度 一 个 在 将 来 的 某 个 时 刻 发 生 的 动作 同时 做 些 其 他 事情 ， 调 
度 一 个 将 要 发 生 的 动作 很 简单 ,通过 调用 alarm 来 设置 计时 器 ,然后 继续 做 别 的 事情 。 当 计 
时 器 计时 到 0, 信号 发 送 , 处 理 函 数 被 调用 。 


7.6 时 钟 编程 2: 间隔 计时 器 


Unix 很 早 就 有 sleep 和 alarm。 它 们 所 提供 的 时 钟 精度 为 秒 , 对 于 很 多 应 用 来 说 这 个 精 
度 基 不 能 让 人 满意 的 。 后 来 一 个 更 强大 和 使 用 广泛 的 计时 器 系统 被 添加 进来 。 这 个 新 的 系 
统 使 用 一 个 被 称 做 为 间隔 计时 器 (interval timer) 的 概念 ,有 更 高 的 精度 。 而 且 每 个 进程 都 有 
3 个 独立 的 计时 咒 而 不 是 原来 的 一 个 。 这 还 不 是 全 部 。 每 个 计时 器 都 有 两 个 设置 ;: 初始 问 
隔 和 重复 间隔 设置 。 新 的 系统 还 支持 alarm 和 sleep, 它们 对 大 多 数 应 用 来 说 已 经 足够 了 。 
7.9 是 它 的 一 个 相应 的 示意 图 . 








| 


PER AB 


每 个 计时 器 有 两 个 设置 ， 
到 第 一 个 信号 的 时 间 和 两 次 
信号 间 的 时 间 阿 配 





| 
真实 虚拟 实用 
图 7.9 每 个 进程 有 3 个 计时 器 


可 以 用 这 个 新 的 系统 来 添加 时 延 和 为 事件 定时 。 
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7.6.1. 添加 精度 更 高 的 时 延 : usleep 

为 了 添加 精度 更 高 的 时 延 ,使 用 usleep: 

usleep(n} 

usleep(n) 3e SW REE » 微 秒 或 者 直到 有 一 个 不 能 被 忽 赂 的 信号 到 达 。 
7.6.2 三 种 计时 器 : 真实 、 进 程 和 实用 


进程 可 以 以 3 种 方式 来 计时 。 考 虑 一 个 程序 在 运行 了 30 s 后 结束 。 在 一 个 分 时 系统 
中 ,这 个 程序 不 是 一 直 在 和 运行 的 ,其 他 的 程序 与 它 共 享 处 理 器 。 图 7. 10 显示 本 一 种 可 能 性 。 


























0 5 )0 1 20 25 30 
Dam KX wie we 6)6 AIR ER ge EUER dnla RAS NU A M doo RN GM Fed > 

用 户 代 码 : NENNEN EE 
内 核 代码 : E x: 
BER i$ ITHE 

A aoe | 
|a m: 真实 30s Hed IO s CHI iHi 用 户 十 核心 态 s 
jh: 直 实 30s EIs HPE ”实用 15s 1 + Bub) 
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图 7.10 最 示 从 0 到 5s 进程 在 用 户 模 式 运行 . 接着 从 5 到 15 s 睡眠 ,然后 在 核心 态 运行 
到 20 s 睡眠 ,如 此 这 般 。 显 然 从 开始 到 结束 ,程序 使 用 了 10 s 的 用 户 时 间 .5s 的 系统 时 间 。 
并 显示 了 3 种 时 间 : 真实 时 间 .用 户 时 间 和 用 户 时 间 十 系统 时 间 。 内 核 提 供 计时 器 来 计量 这 
3 种 类 型 的 时 间 。3 类 计时 器 的 名 字 和 功能 如 下 : 

(1) IYIMER_REAL 

ix ET RE TP AEE Se IY a]. CO), 也 就 是 说 不 管 程序 在 用 户 态 还 是 核心 
态 用 了 多 少 处 理 器 时 间 它 部 记录 :. 当 这 个 计时 器 用 尽 ,发 送 SIGALRM 消息 ， 

(2) ITIMER_VIRTUAL 

IX Tr iT 9E ERR RMR PAM, RU ETE HL Ae AO A at. BB EL 
iT BY AS (virtual timer) A9 30 s 比 实 际 计 时 器 (real timer) A) 30s RK. 当 虚 拟 计 时 器 用 尽 , 发 
送 SIGVTALRM 消息 。 

(3) ITIMER_PROF 

这 个 计时 器 在 进程 运行 于 用 户 态 或 由 该 进程 调用 而 陷 六 核心 态 时 计时 。 当 这 个 计时 器 
用 尽 . 发 送 SIGPROF WE. 


7.6.3 两 种 间隔 : 初始 和 午 复 


医生 给 你 一 些 药 丸 并 告诉 你 ;“ 过 一 个 小 时 了 吃 第 一 粒 , 然 后 每 隔 4 个 小 时 吃 一 粒 ," 你 需 
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要 设置 计时 器 到 1 个 小 时 ,然后 在 每 次 时 尽 后 再 设置 为 4 个 小 时 。 每 个 间隔 计时 器 的 设 寻 都 
有 这 样 两 个 参数 : 初始 时 间 和 重复 间隔 。 在 同 隔 计时 器用 的 结构 体 中 初始 时 间 是 it value, 
重复 间隔 是 it_interval。 如 果 不 想 要 重复 这 一 特征 .将 t interval RE WO. RIL M PATH 
都 关 掉 , 设 it_value 为 0。 


7.6.4 用 间隔 计时 器 编程 


程序 中 使 用 alarm AE. RES alarm 秒 数 就 可 以 了 。 程 序 中 使 用 间隔 计时 器 要 
复杂 一 点 ,要 选择 计时 器 的 类 型 ,然后 需要 选 掺 初始 间隔 和 重复 间隔 ,还 要 设 君 在 struct 
itimerval 中 的 值 。 比 如 ,为 了 使 用 间隔 计时 器 来 提醒 你 壤 7.6.3 节 规定 的 计划 吃 药 , 没 
£u value 为 1 小 时 ,设置 ijinterval 为 4 小 时 .然后 将 这 个 结构 体 通过 调用 setitimer f£ 
给 计时 器 。 为 了 读 取 计时 器 设置 ,使 用 getitimer。 图 7. 11 是 系统 响应 的 示意 图 . 














| struct itimerval 


gelilimer ( ) 








E7.0 #BHH eR 


l. f tt ot BHF: ticker_demo. c 
程序 ricker, demo. c 演示 了 如 何 使 用 一 个 同 珊 计时 器 ; 


/* tieker dema.c 
* demonstrates use of interval timer to generate reqular 
signals, which are in turn caught and used to count down 


x/ 


E include <stdio.h> 
# include <_sys/time, h> 
# include -Zsignal. b> 


int main() 
1 
i 


void countdown int); 


Signal(SIGALRM, countdown); 

if ( set tícker(500) == -1) 
perror("set ticker"); 

else 
while( 1) 
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pause(); 


return 0; 


void countdown(int signum) 
1 
1 
static int num = 10; 
printf("&d ..", num -— }; 
fflushtstdout); 
if ( num « 0 2f 
printf("DONE! \n"); 


exit(0); 


/* [from set_ticker.c | 

* set ticker( number of milliseconds ) 

* arranges for interval timer to issue SIGALRMs at regular intervals 
* returns —1 on error, 0 for ok 

* arg in milliseconds, converted into whole seconds and microseconds 
* note; set ticker(0) turns off ticker 


x/ 


int set ticker( int n msecs ) 
i 
struct itimerval new timeset; 


long n sec, n usecs; 


n sec = n msecs / 1000 ; /* int part «/ 

n usecs = ( n msecs * 1000) + 1000L ; /* remainder x/ 

new timeset.it interval. tv sec = n sec; /*set reload #/ 

new timeset.it interval.tv usec- n usecs; /*new ticker 
values/ 

new timeset.it value.tv sec = n sec; /*store thigx/ 


new timeset.it value.tv usec  * n usccs; /*and this*/ 


return setitimer(ITIMER REAL, &new timeset, NULL): 


来 看 看 ticker demo. c 的 程序 流程 。-- 开 始 使 用 signal 设置 函数 countdown 来 处 理 
SIGALRM 信息 。 然 后 通过 set_ticker Kit EMEA, 

set ticker 通过 装载 初始 间隔 和 重复 间隔 设置 间隔 计时 器 。 每 个 间隔 是 由 两 个 值 组 成 ; 
秒 数 和 微 秒 数 ,这 就 像 实数 的 整数 部 分 和 小 数 部 分 。 计 时 器 开始 计时 ,控制 返回 到 main. 
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回 到 main, ticker. demo. c 进入 一 个 无 尽 的 循环 ,其 间 调 用 pause。 每 过 大 约 500 ps, 控 
制 跳 转 到 countdown E. countdown 将 一 个 静态 变量 的 值 递减 ,打印 一 条 消息 ,通常 情况 
下 返回 调用 者 ， 当 变量 num 达到 0 时 ,countdown WHA exit, 

当然 .main 不 是 一 定 要 调用 pause AJ, ERP TURE aH KREBS 
预定 的 时 刻 还 是 会 跳 转 到 countdown BJ. 

间隔 计时 器 的 设置 是 通过 struct itimerval 来 完成 的 。 这 个 结构 类 型 包括 初始 间隔 和 和 重 
复 间 隔 , 两 者 存储 在 struct timeval 中 ， 


struct itimerval 
{ 
struct timeval ít value; /x time to next rimer expiration»/ 
struck timeval it interval; /* reload it, value with this */ 
} 
struct timeval | 
time Lt tv sec /* gecondss / 
suseconds t tv usec; /* and microseconds*/ 


} 


不 同 的 Unix 版 本 ,struct timeval 的 细节 可 能 有 些 差 异 。 查 一 下 你 的 系统 的 相应 手册 和 
头 文件 。 

图 7.]2 显示 了 结构 中 各 成 员 的 关系 ,图 7.13 显示 了 如 何 载 人 化 据 以 使 第 一 次 计时 器 到 
达 时 间 为 60. 5 s, 然 后 每 240. 25 s 重复 一 次 。 








ITIMER_REAL ITIMER VIRTUAL ITIMER PROF 
I = 
it value .| | | it value | | it value ey 
it_interval | | | | it interval 的 a E 


bs 














struct iumerval struct timeval 
PNA PILE. 剩 下 的 时 间 和 struct imevad 有 两 个 成 员 
重复 时 间 . 这 两 个 设置 宙 struct timeval 变量 ; 秒 数 和 微 秒 数 


中 的 两 个 成 员 变 量 表示 


图 7.12 间隔 计时 此 内 部 
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ITIMER, REAL 这 个 例子 中 将 记录 真实 时 间 
BISHER SHEET 60.5 s 


| d val 0 | 500000 
| caes [s [mme] | a AEE MUS 


- - rU EE EG 
t AMeNenval | 2) 250000] | 也 24025s 传递 一 次 信 半 。 






































L ENT 
图 7,13 秒 和 微 秘 
2. 系统 调用 小 结 
getitimer , setitimer 
目标 取得 或 设置 间隔 计时 器 。 l 
twee # include <i sys/time. h> 
函数 原型 result = getitimer(int which, 


struct itimerval * val); 
result = sctitimer( int which, 
const struct itimerval * newval, 


struct itimerval * oldvaD ; 








参数 which 获取 或 设置 的 计时 器 
val 向 当前 设置 值 的 指针 


newval HERR BARE 
oldval 指向 被 替换 的 设置 值 的 指针 











返回 值 一 1 出 错 
0 成 功 


getitimer 将 某 个 特定 计时 器 的 当前 设置 读 到 val 指向 的 结构 中 。setitimer 将 计时 器 设 
置 为 newval 指向 的 结构 的 值 。 如 果 oldval 不 指向 null, 之 前 计时 器 的 设 定 将 被 复制 到 
oldval 指向 的 结构 中 。 

which 的 值 指定 将 要 被 读 或 更 新 的 计时 器 。 计 时 器 的 编码 分 别 是 ITIMER_REAL、 
ITIMER VIRTUAL 和 ITIMER PROF, 


7.6.85 计算 机 有 几 个 时 钟 


如 何 才能 让 每 个 进程 有 3 个 独立 的 计时 器 ? 有 些 系 统 同时 有 几 百 个 进程 在 运行 。 计 算 
机 里 有 郊 百 个 独立 的 时 钟 吗 ? 不 ,一 个 系统 只 需要 一 个 时 钟 来 设置 节拍 。 这 就 像 用 一 个 节 
拍 恬 来 为 一 个 站 乐 四 重奏 乐团 定 拍子 ,或 者 像 有 规律 摆动 的 钟 摆 驱动 一 个 古老 钟表 里 的 几 
根 指针 。 一 个 硬件 时 钟 的 脉冲 是 计算 机 里 惟一 需要 的 时 钟 。 如 何 呈 用 一 个 时 钟 在 设置 一 个 
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进程 的 私有 计时 器 为 5s 的 同时 又 设置 男 一 个 进程 的 私有 计时 器 为 12 s? 

一 个 古老 的 上 时钟 是 如 和 何 让 时 针 、 分 针 狂 秒针 以 不 同 的 速度 转动 的 ? 它们 的 答案 是 一 样 
的 。 每 个 进程 设置 自己 的 计数 时 间 , 损 作 系 统 在 每 过 一 个 时 间 片 后 为 所 有 的 计数 器 的 数值 
WER. — “PS SE BR OY IF OT ELTE RECS BET 

考虑 两 个 进程 : 进程 A 和 进程 B, VERLA 设置 它 的 真实 计时 器 (real timer) 29 5 ,进程 
B 设置 它 的 真实 计时 器 为 12 s。 为 了 使 数字 看 起 来 简单 ,假设 系统 时 钟 每 秒 吨 100 下 。 当 进 
程 A 设置 它 的 时 钟 时 ,内 核 设置 它 的 计数 器 为 500。 当 进程 B 设置 它 的 时 钟 时 ,内 核 设置 它 
的 计数 器 为 1200, 如 图 7. 14 所 示 。 


m | 3 
| | 

















a> PRM AMS 一 个 真实 的 对 钟 
每 个 进程 通过 调用 alarm 来 设置 它 的 私有 计 灶 器 。 内核 在 每 次 
收 到 时 钟 中 断 的 有 时候 更 新 所 有 的 进 各 计 时 器 


图 7.14 两 个 计时 器 ,一 个 时 名 


每 当 内 核 收 到 系统 时 钟 脉冲 , 它 忆 历 所 有 的 间隔 计时 器 ,使 每 个 计数 器 减 一 个 时 钟 单 
位 。 当 进程 A 的 计数 器 达到 0 的 时 候 . 意味 着 已 经 有 500 时 钟 节拍 过 去 了 ,内 核发 送 
SIGALRM 给 进程 A。 如 果 进 程 A 已 经 设置 了 计时 器 的 interval 值 ,内 核 将 这 个 值 复制 到 
it_value 计数 器 ,否则 内 核 就 关 掉 这 个 计时 器 。 

所 过 一 会 ,内 核 将 进程 B 的 计数 器 也 减 到 0, 相应 地 向 进程 B 发 出 信号 。 如 果 了 日 设置 了 
计时 器 的 重 载 值 (reload value). AYRE EE it_value 为 相应 的 值 ,然后 继续 处 理 下 一 个 计 
BY 23. 

道 过 这 个 简单 的 机 制 ; 每 个 进程 就 可 以 设置 自己 的 计时 器 。 这 个 计时 器 在 进程 睡眠 的 
时 候 也 在 倒计时 。 

其 他 的 两 个 计时 器 如 何 工 作 ? 它们 不 是 图 定 的 倒计时 ,而 仅仅 在 进程 处 于 某 个 特定 状 
态 时 倒计时 。Linux 源 代码 清楚 地 给 出 了 它们 是 如 何 实 现 的 。 


7.6.6 计时 器 小 结 


一 个 Unix 程序 用 计时 器 来 挂 起 执行 和 调度 将 缕 来 取 的 动作 。 一 个 计时 器 是 内 核 的 一 
种 机 制 。 通 过 这 种 机 制 , 内 核 在 一 定 的 时 间 之 后 向 进程 发 送 SIGALRM。alarm 系统 调用 在 
特定 的 实际 秒 数 之 后 发 送 SIGALRM 给 进程 。setitimer 系统 调用 以 更 尚 的 精度 控制 计时 
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器 ,同时 能 够 以 团 定 的 时 间 闻 隔 发 送信 号 。 
现在 已 经 知道 如 何在 程序 中 计时 了 。 要 实现 视频 游戏 还 需要 一 项 技术 : 管理 中 断 ， 


7.7 信号 处 理 1: 使 用 signal 


这 个 游戏 必须 处 理 中 断 。 可 能 当 用 户 按 下 一 个 键 的 时 候 程 序 正在 移动 一 幅 图 片 ,或 者 
在 处 理 一 个 用 户 输入 的 时 候 , 计 时 器 发 来 一 个 信和 号。 如果 游 戏 支 持 双人 游戏 , 当 … 个 人 按键 
的 时 候 程序 可 能 正在 处 理 另 一 个 人 的 输入 。 

中 断 处 理 是 操作 系统 和 系统 软件 的 关键 部 分 ，Unix 中 的 软件 中 断 被 称 为 信和 号 
(signals)。 现 在 需要 深入 理解 信号 处 理 。 作 为 开始 , 先 回 顾 一 下 早期 的 Unix 信号 处 理 模 
型 ,然后 看 看 它 有 些 什么 问题 ,最 后 再 学 习 POSIX (Unix 型 可 移植 操作 系统 接口 ) 的 信和 号 处 
理 模型 。 


7.7.1 早期 的 信号 处 理 机 制 


各 种 事件 促使 内 核 向 进程 发 送信 号 。 这 些 事件 包括 用 户 的 击 键 、. 进 程 的 非法 操作 和 计 
时 器 到 时 。 第 6 章 介绍 了 早期 的 信号 处 理 模型 。 一 个 进程 调用 signal 在 以 下 3 种 处 理 信和 号 
的 方法 之 中 选择 : 

CD BRAHE BERE SE IE ERD ,比如 ,signal(SIGALRM ,SIG_DFL) 

(2) ATEB .ul.signalSIGALRM,SIG IGN) 

(3) 调用 一 个 函数 ,比如 ,signal(SIGALRM handler) 


7.7.2 处 理 多 个 信号 


如 果 只 有 一 个 信号 要 处 理 , 原 始 的 信号 处 理 模 型 足以 应 付 。 如 果 有 多 个 信和 号 到 达 会 发 
生 什 么 事情 ? 如 果 响 应 定义 为 终止 (termination) 或 者 是 忽略 (Cignore) , 那 结 果 很 清楚 。 但 是 
如 果 是 调用 (inyoke) 一 个 函数 来 响应 ,那么 结果 就 不 那么 明显 了 。 

1. WASPA 

{AS Sh A RR. — f m BRAT AS BOR RET PERS EMRE HR. 
24 [e 4 9 E BUR FS Ae RRR MART. 

在 早期 的 版 本 中 ,信和 号 处 理 函 数 在 另 一 个 方面 也 很 像 捕 鼠 回 : 在 每 次 捕获 之 后 ,都 必须 
重新 设置 它们 。 比 如 : 一 个 信和 号 处 理 函 数 可 能 如 下 : 


void handler( int s) 

{ 
/*process is vulnerable heres / 
sSignal(SIGINT,handler?; /xreset handler», 


/*do work heres / 





) 


AE VERE AY IE A COE EAE E IS D EB ERU IE SEL I] 就 有 可 能 
TE BGEGE T. xx — B 8 ARERR A fir RE ERAS ETE. A EARRA "I RI SERO f 
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号 ” ,就 好 像 说 "不 可 靠 的 老鼠 "一 样 . 这 倒 有 些 奇 怪 了 。 

2. 设计 一 个 亚 好 的 系统 

捅 息 器 疝 题 只 是 早期 信号 系统 的 一 个 罚 点 。 为 了 能 党 明 问 题 的 复杂 性 ,考虑 以 下 这 些 
实际 生活 中 的 问题 。 

3. RSME 

真实 世界 充满 信 导 ,也 就 是 意外 的 打扰 .假设 你 在 办 公 室 里 工作 。 电 话 可 能 会 响 , 可 能 
有 人 项 门 , 或 者 火警 响起 。 对 于 这 些 事件 .可 以 忽略 ;也 可 以 处 理 。 处 理 一 个 电话 意味 着 放 
下 当前 的 工作 , 舍 起 电话 ,与 打 电 话 的 人 交谈 ,村 起 电话 ,然后 回去 做 放 在 一 边 的 工作 。 处 理 
B UTR aX FR HA bL a 

4n RK DH EG B ras BY OT oe ae TSE PE? 你 得 放下 电话 , 按 保 持 链 ,开门 ,和 来 访 
者 交谈 ,然后 回去 继续 接 电话 。 在 接 完 电 顷 之 后 , 园 到 办 公 桌 汶 继 续 工 作 。 这 种 情况 下 ,第 
二 个 信号 打 斯 了 对 第 一 个 信号 的 处 理 . 

接 下 来 .正当 你 与 第 一 个 米 访 者 实效 时 ;第 二 个 来 访 者 来 了 又 该 怎么 办 呢 ? 一 般 人 情况 

下 ,第 一 个 人 会 挡住 门 .这样 第 二 个 人 就 得 等 你 与 第 一 个 人 交谈 完毕 。 当 你 与 第 一 个 人 交谈 
完毕 ,第 二 个 人 就 可 以 误 门 了 。 这 种 情况 下 , 称 第 二 个 来 访 者 在 接待 第 一 个 来 访 者 结束 之 前 
Hi MÆ (blocked). 

还 有 ,如 果 米 访 者 来 沪 的 时 候 你 正 专注 于 电话 那 头 讲话 怎么 办 ? 当 你 从 门口 回来 重新 
拿 起 电话 ,是 继续 刚才 的 话题 还 是 告诉 对 方 你 已 经 忘记 刚刚 说 到 哪儿 了 ? 

最 后 ， BAR EE ORAL LX BAD PRAT HT SAT SUR? 如 果 一 个 像 火警 
一 样 重要 的 信号 达到 ,你 或 许 希 望 阻 骞 其 他 信号。 就 像 你 在 处 一 火警 叶 不 会 管 电话 铃 是 否 
BT RAR AA A METI, SE WEI. Up A Ah R EE OL HST, 

4. 进程 的 多 个 信号 

进程 要 而 对 的 问题 和 你 要 面 对 的 没有 什么 太 大 不 同 。 想 象 一 个 进程 在 它 的 小 尾 ( 内 存 ) 
里 工作 。 如 图 7.15 所 示 ,， 用户 可 能 通过 按 下 Cul- C 来 产生 一 个 SIGINT 信号 ,或 者 是 
Ctr]~\ 产 生 SIGQUIT 信号 ,或 者 计时 器 到 时 产生 一 个 SIGQLRM 信和 号。 就 像 电 话 和 敲 门 的 
访 者 ,所 有 这 些 信 号 可 能 同时 到 达 。 在 Unix 系统 里 ,一 个 进程 如 何 响应 多 个 信号 ? 















SIGINT handler 
SIGQUIT handler 
SIGALRM handler 


7.15 — T HEIC ^ EGLI UE ER 


CD) 处 理 函 数 每 次 使 用 之 后 都 要 被 禁用 吗 ? CONSEC OS SUD 
(2) 如 果 SIGY HB FUE FE Ab BB SIGX 消息 时 .到 达 会 发 生 什么 ? 
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(3) 如 果 进 程 还 在 处 理 前 一 个 SIGX 消息 时 ,第 二 个 SIGX 消息 又 到 来 会 发 生 什 么 ? 第 
=P MAT We? 

(4) 如 果 消 息 到 来 时 ， 程 序 正 在 处 理 getchar 或 者 read 之 类 的 输入 而 阻塞 , 那 会 如 何 ? 

不 同 版 本 的 Unix 的 答案 各 不 相同 。 写 一 个 在 各 个 系统 下 都 能 正常 工作 的 程序 很 不 
容易 。 


7.7.3 测试 多 个 信号 


系统 是 如 和 何 回答 这 些 问题 的 ?编译 并 运行 sigdemo3. c, 看 看 你 系统 中 的 进程 是 如 何 响 
应 信和 号 组 合 的 : 


/* sigdemo3.c 
* purpose; show answers to signal questions 
* questionl; does the handler stay in effect after a signal arrives? 
* question2; what if a signalX arrives while handling signalX? 
* question3. what if a signalX arrives while handling signalY? 
x questiond, what happens to read() when a signal arrives? 
x / 


# include <stdio.h> 
# include < signal. h> 


# define INPUTLEN 100 


main(int ac, char * av[ l) 

{ 
void  inthandler(int); 
void quithandler(int); 
char input[iNPUTLEN]; 


int nchars; 

signal( SIGINT, inthandler ); /* set handler x/ 
signal( SIGQUIT, quithandler ); /* set handler «/ 
do | 


printf( "\nType a nessagen"); 
nchars = read(0, input, (INPUTLEN ~ 12); 
if ( nchars == 一 1 》 
perror( "read returned an error"); 
else { 
input[nchars] = '\O'; 
| printf("You typed, % s", input); 


; 


whiie( strncmp( input , "quit", 4) 1= 0); 
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void inthandler(int 3) 

{ 
printf(" Received signal $d.. waiting\n", 8 5; 
sleep(2); 
printf(" Leaving inthandler in"); 

} 

void quithandier(int s) 

{ 
printf(" Received siqnal &d . waiting\n", s); 
sleep(3); 
printf(" Leaving quithandler Mn"); 

) 


EXE LA AS TE 8977 3X8 BL A A T [AE ER Curl-C 和 Ctrl-\。 特 别 地 ,以 不 同 的 时 
延 , 试 试 以 下 组 合 跟 踪 图 7.16 中 显示 的 函数 的 控制 流 。 

O) CCCC 

(2) Vv C'NC 

(3) hello'C Return 

(4) hello Rern'C 

(5) "VNhelloC 





main Joop 一 一 Lua readi0ybuf.len]; |- 5. 4H 
tol buf,-ni; - | 
BD Vel EAE EI et dui Sec 










i Et ES i i 1 hs ios sm 
“Chandler r ; i- j E k xi a. ES em zt ee, “3 
“handler 1 eS he cant : ja PER 

| i zh mk Airfid FR Ferdi see et 


图 7.16 BRAE eh aS Fo e DE 





这 些 试验 的 结果 显示 了 你 的 系统 是 如 何 处 理 信号 组 合 的 。 

|, RYH HHA) 

如 果 两 个 SIGINTS 信号 杀 死 了 进程 ,那么 意味 着 你 的 系统 是 不 可 靠 的 信号 ; AH 
GAS RBS. MRED SIGINTS 信和 号 没有 杀 死 进程 , 意 昧 着 人 处理 联 数 在 被 调用 后 还 起 
作用 。 现 代 信 号 处 理 机 制 允 许 你 在 两 省 之 间 做 出 选择 。 

2. SIGY 47a SIGX & Ap x9 HM SH HRAA RN) 

当 接 连 按 下 Ctrl - C 和 Cirl-\ 会 看 到 程序 先 跳 到 inthandjer, 接 着 跳 到 quithandler, RIE 
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再 回 到 inthandjer, 最 后 回 到 主 循环 。 你 的 试验 结果 是 如 何 的 ? 

3. SIGX 41 8t SIGX 的 处 理 函 数 ( 两 次 高 门 ) 

这 种 情况 就 像 蝎 个 人 来 禹 门 。 有 有 3 种 处 理 的 方法 ; 

OD 递归 ,调用 同一 个 处 理 消 数 攻 ; 

(20 忽略 第 二 不 信号 ,这 和 没有 呼 明 等 待 功能 的 电话 机 类 似 ; 

(3) 阻塞 第 二 个 信号 直到 第 一 个 处 理 完毕 。 

原来 的 信号 处 理 系 统 使 用 方法 (1), 人 允许 递归 测 用 。. -个 更 安全 的 选择 是 方法 (3)。 就 
像 第 二 个 人 来 斋 门 ;第 二 个 信号 被 阻塞 而 不 是 忽略 ,上 自 到 第 -- 个 信号 被 处理 完 。 你 的 系统 阻 
塞 第 一 个 信号 吗 ? LER dd ROS Me SHAMS? 

4. 被 中 断 的 系统 调用 { 接 电话 的 时 候 有 人 项 门 ) 

这 种 情况 经 常 改 生 。 程 序 经 常 在 等 待 输入 的 时 候 接 收 到 信和 号。 在 上 上面 邦 个 测试 程序 
中 , 主 循环 阳 塞 以 等 待 键盘 的 输入 (read JA). 254 AB BC Ctrl-C) SOR HB (Ctrl LO BE 
POR Pl fas hee, BORA i BREA EMH WAKE RAS. 
(ASA AUN? Me A “hel” $e RR Ctrl-C 然后 下 继续 输入 “lo” 再 回 车 会 如 何 呢 ? 程 
序 看 到 的 是 完整 的 “hello” 还 是 只 有 “lo”? 程序 是 重新 开始 read 还 是 从 read 返回 同时 设置 
errno 到 EINTR? 

EB RE IR E? 在 AT&T BU Unix 中 是 返回 并 设置 EINTR 为 一 1( 经 典 模 
式 ) ,而 在 UCB 中 会 自动 的 重新 开始 ，。 


7.7.4 信号 机 制 其 他 的 弱点 


早期 的 信号 系统 还 有 两 个 弱点 。 

1 不 知道 信号 被 发 送 的 原因 ， 

信号 处 理 是 数 是 一 个 在 信号 到 达 的 时 候 被 调用 的 隔 数 。 内 核 传 给 处 理 旷 数 一 个 信和 号 数 
字 编 号 。 在 sigdemo3. c 中 函数 inthandler 被 调用 时 得 到 一 个 值 为 SIGINT 的 实 参 。 将 信号 
编导 作为 参数 传 给 处 埋 函 数 使 一 个 画 数 可 以 处 理 客 个 信号 。 比如 ,在 sigdemo3.e PAT LEHI 
一 个 处 理 画 数 在 代 原 来 的 两 个 处 理 函 数 , 根 据 参 数 来 决定 打印 什么 。 

早期 的 模型 挫 告诉 处 理 药 数 它 被 调用 是 由 什么 类 型 的 信号 而 引起 的 ,但 是 没有 告 之 为 
什么 会 生成 信号 。 比 如 , 几 种 算术 错 涡 会 引起 泽 点 异常 (floating 一 point exception). Ho Sup 
HAS Sh A P db. BE ROBONS Se ae. 

2. AER E PRERA IBGE XC iN d 

响应 一 个 火警 时 ,一 般 情 况 下 会 忽略 电话 铃声 。 恨 设想 让 程序 在 响应 SIGINT 时 忽略 
SIGQUIT。， 使 用 经 典 售 叶 机 制 修改 inthandler, 如 下 所 示 : 


void inthandler(int s) 
i 
int rv; 
void ( x prev ghandler)(); /*holds prev handler» / 





由 ”这 是 非 显 式 递归 ,因为 处 理 函 数 并 没有 调用 自己 ,但 其 效果 同 普通 的 递归 相似， 
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prev ghandler = signal(SIGQUIT,SIG TGN); 
fxignore QUITsx*/ 


signal(Sl1GQUIT,prev qhandler); /xrestore handlers / 


RE. FEE A rp By ah 38 o cat EE AG dh IP a ER RE. RA 
两 个 问题 。 第 一 在 调用 inthandler 和 调用 signal Clee KA TE. RR a A 
inthandler 和 忽略 SIGQUIT 同时 进行 。 第 二 ,这 里 并 不 想 忽 酷 SIGQUIT ,而 只 是 想 阻 塞 它 
直到 inthandler 处 理 完成 ,如 同 想 在 火警 之 后 再 回来 接 电话 。 在 处 理 完 关键 事件 后 .还 是 很 
高 兴 看 到 SIGQUIT 问 来 工作 ， 


7.8 信号 处 理 2: sigaction 


在 过 去 的 几 年 中 ,针对 原来 的 模型 所 产生 的 问题 ,各 种 相关 组 织 开 发 出 了 一 些 不 同 的 解 
决 方案 。 这 里 将 只 学 习 POSIX 模型 和 相关 的 系统 调用 。 经 典 的 信号 系统 依旧 被 支持 ;而且 
在 一 些 应 用 中 这 些 就 够 了 。 


7.8.1 处 理 多 个 信和 号 sigaction 


在 POSIX 中 用 sigaction 替代 signal。 参 数 非常 相似 。 指 定 什 么 信号 将 被 如 何人 处 理 。 如 
果 愿 意 , 还 能 得 到 这 个 信号 上 一 次 被 处 理 时 的 设置 。 


int sigaction(signalnumher, action, prevaction) 

















这 个 函数 的 概要 如 下 。 
sigaction 
Rf 指定 - -个 信号 的 处 理 前 数 
头 文件 F include <“signal, hz 
RR RB res =sigaction(int signum, 


const struct sigaction * action, 


struct sigaction * prevaction) ; 


$u signum RAAHE S 
action 指针 ,指向 描述 操作 的 结构 
brevaction ”指针 ,指向 描述 被 替换 操作 的 结 梅 
i BK -i FB 
0 成 功 











第 一 个 参数 signum PABBA Ra, BOP BR action 指向 描述 如 何 响应 信和 号 
结构 体 。 第 三 个 参数 prevacion MRA null 的 话 ,就 是 指向 描述 被 蔡 换 的 处 理 设置 的 结 
术 体 。 如 果 新 的 操作 设 转 成 功 则 返回 0, 售 则 返 轩 --1。 
1. 定制 信号 处 理 : struct sigaction 
在 过 去 , 面 对 信 号 的 处 理 只 有 简单 的 几 种 选择 : SIG_DFL .SIG_IGN 或 者 函数 处 理 。 这 
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些 洗 项 在 新 的 系统 中 作为 结构 体 sigaction 的 部 分 定义 依然 提供 。 结 构 体 sigaction 定义 了 如 
何 处 理 一 -个 信和 号 。 以 下 是 这 个 结构 体 的 完整 定义 : 


struct sigaction| 
/* gc only one of these two xy 
void ( * sa, handler); /*SIG DFL,SIG IGN,or function #/ 


void (* sa sigaction)(int,siginfo t * ,void *); /x new handler x/ 


sigset_t sa mask; /* signals to block while handling */ 
int sa flags; /* enable various behaviors */ 


l 
了 


(1) 选择 sa handler 还 是 sa sigaction? 

首先 ,要 在 老 的 信号 处 理 方式 和 新 的 更 强大 的 信号 处 理 方 式 之 间作 出 选择 。 如 果 老 的 
处 理 方式 ( 即 SIG_DFL .SIG_IGN 或 者 处 理 函 数 ) 就 够 用 了 ,那么 可 以 设置 sa_handler 为 其 
rpz—. SR ,如果 指 定 为 上 的 信号 处 至 方 式 ,那么 只 能 得 到 信号 编号 ， 和 否则 ,如 果 设 定 sa 
sigaction Xj — ^ &b X BE fr ,那么 那个 处 理 函 数 被 调用 的 时 候 , 不 但 可 以 得 到 信号 编号 而 且 可 
以 获悉 被 调用 的 原因 以 及 产后 问题 的 上 下 文 的 相关 信息 。 病 者 之 癌 的 差异 总 结 如 下 。 


fi FHIEL BS AE EE Ld - 使 用 新 的 处 理 机 制 : 
struct sigaction action; action. sa_handler = handler_old; 
struct sigaction action; action. sa_sigaction = handler new; 


如 何 告诉 内 核 你 使 用 的 是 新 的 信号 处 理 方式 ? 很 简单 ,只 需 设 置 sa_flags 的 SA. 
SIGINFO fi. 

(2) sa_flags 

然后 TRAE Ab IE R OE n der We AT AY 4 RM, sa flags 是 用 一 些 位 来 控制 处 理 
Pa A ER 4 个 问题 的 。 相 关 的 细节 可 以 在 手册 上 查 到 。 下 面 是 部 分 列表 。 























d g * x 
SA RESETHAND ED Fe BRU PE MEE OR A Y Eoi E. 
SA NODEFER 在 处 理 信 号 时 关闭 信号 自动 阻塞 。 ix HORDQOVEERUJN HRS a E 
EB 
SA RESTART 当 系 统 调 用 基 针 对 一 些 慢 速 的 设备 或 类 似 的 系统 调用 ,重新 开始 ,而 
不 是 返回 。 这 样 是 采用 BSD 模式 
SA_SIGINFO 指明 使 用 sa sigaction Sb PR CDU (8. MR TRA dr B.E 


入 就 合用 sa handler fi jel fg Ah JE B X OBL. TE sa_sigaction RBA. 
fig A IE XB ROR RR S ANS LE Rodi d eg dl SKE MRA 
条 件 的 结构 体 


(3) sa_mask 
最 后 ,决定 在 处 理 一 个 消息 时 是 否 要 阻塞 其 他 信号 。sa_mask 中 的 位 指定 哪些 信和 号 要 被 
PAE. 使 用 sa_mask, 可 以 在 逃离 火灾 现场 时 阻塞 电话 呼叫 和 来 访 者 。sa_mask 的 值 包括 要 
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被 阻塞 的 信和 号 集 。 阻 塞 信号 是 防 赴 数据 损毁 的 重要 技术 。 下 一 章 将 详细 介绍 这 个 主题 。 

2. HF: 使 用 sigaction | 

Fi BS ET E T an fay t JH sigaction (注意 程序 如 和 何 做 到 在 处 理 SIGINT 时 阻塞 
SIGQUIT fp; 


/* sigactdemo.c 


* purpose, shows use of sigaction() 

* feature , blocks ^X while handling ^C 

x does not reset ^C handler, so two kill 
f 


# include <Cstdio. h> 
# include «signal, h> 
H#define INPUTLEN 100 


maint) 

1 
struct sigaction newhandler; /* new settings */ 
sigset t blocked; /* set of blocked sigs «/ 
void inthandler(); /* the handler «/ 
char x[ INPUTLEN | ; 


/* load these two members first x/ 
newhandler.sa handler = inthandler; 

/* bandler function */ 
newhandler.sa flags = SA RESETHAND | SA RESTART; 


/* options #/ 


/* then build the list of blocked signals x/ 


sigemptyset(&Kblocked); /* clear ali bits +/ 
sigaddset(&blocked, SIGQUIT) ; /* add SIGQUIT to list x/ 
newhandler,sa mask = blocked; /* store blockmask »/ 
if ( sigaction(SIGINT, &newhandler, NULL) == -1) 

perror( "sigaction'); 
else 

while( 1 ){ 


fgets(x, INPUTLEN, stdin); 
printf£( "input: % s", x); 


} 


void inthandler(int s) 

1 
printf("Called with signal & dn", €); 
sleep(s); 
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printf("done handling signal % d\n", $8); 
] 


试车 运行 这 个 程序 。 如果 以 很 快 的 速度 连续 按 Ctrl-C 和 Cer 2 BMS eSB 
Sir fe ab ESSERE. AO ESRI TAF Cri -C, 进 程 就 将 被 第 一 个 信号 杀 死 。 如 果 想 要 捕 
获 所 有 的 Ctrl-C, 将 SA_RESETHAND ÉI A sa flags P H. 


7.8.2 信号 小 结 


一 个 进程 可 能 被 各 种 来 源 的 信号 中 断 。 信 和 可 能 在 任何 时 候 以 任何 顺序 到 达 。signal 
提供 了 一 种 简单 但 是 不 完整 的 信号 处 理 机 制 。POSIX 接口 , 即 sigaction 提供 了 复杂 的 ,明确 
定义 的 方法 来 控制 进程 如 何 对 各 种 信号 组合 做 出 反应 。 

现在 已 经 知道 如 何在 程序 中 管理 时 间 和 中 断 。 视 频 游戏 还 需要 最 后 一 项 技术 : 防止 
TE BL. 


7.9 防止 数据 损毁 (Data Corruption) 


你 曾经 被 同时 做 甩 件 事情 搞 得 芭 头 转向 并 头 此 犯错 误 的 经 历 吗 ? 如 果 门 铃 在 你 寻找 
邮票 的 时 候 响 起 ,你 可 能 会 寄 出 一 封 没有 贴 邮票 的 仿 。 程序 也 有 同样 的 问题 。 当 它们 正在 
处 埋 一 件 事情 时 被 将 用 到 其 他 地 方 ,它们 就 可 能 会 被 摘要 以 至 于 把 事情 弄 得 一 所 糟 。 

来 看 看 在 现实 生活 中 中 断 是 如 和 何 引起 数据 错误 的 。 然 后 堂 习 在 程序 中 如 何 防止 这 种 情 
ES. 


7.9.1 数据 损毁 的 例子 


继续 那个 办 公 室 的 例子 。 殴 你 办 会 室 门 的 人 要 把 他 的 和 名字 和 地 址 和 到 一 个 列表 里 。 每 
个 人 只 在 列表 的 最 后 添加 一 项 记录 ; 姓名 、 街 道 . 城 市. 省份 和 邮编 。 考 虑 以 下 两 个 问题 。 

第 一 , 当 -- 个 人 正在 往 列 表 里 写 信息 时 有 人 打 电 话 来 要 列表 里 的 名 字 和 地 址 。 如 果 你 
将 列表 的 信息 读 给 人 家 ,就 会 有 给 出 不 完整 信息 的 可 能 。 这 可 以 通过 在 受 访 时 挂 掉 电话 来 
阻止 这 类 错误 的 发 生 。 

第 二 ,考虑 一 个 不 同 的 问题 。 当 一 个 访问 者 刚刚 把 姓名 填 好 ,第 二 个 SIGKNOCK 信和 号 
到 达 。 如 果 人 允许 递归 的 信号 人 处理, 第 一 个 访 者 要 等 第 二 个 访 者 填 好 他 的 信息 后 再 继续 在 列 
表 的 未 尾 填 自己 余下 的 信息 。 这 样 列 表 就 包含 了 错误 的 数据 : -- 条 记录 在 另外 一 条 记录 中 
间 。 这 可 以 通过 一 个 接 一 个 而 不 是 递 妇 的 接待 访 者 来 防止 这 类 错误 ， 

这 两 个 例子 说 明了 在 一 些 情况 下 一 个 操作 不 应 该 被 其 他 操作 打 断 。 在 对 一 个 数据 结构 
《这 里 是 列表 ) 改 动 结束 之 前 ,其 他 函数 不 能 读 或 写 这 个 数据 结构 。 当 然 ,处 理 像 火警 一 类 的 
信号 是 安全 的 ,因为 这 类 处 理 并 不 读 或 修改 数据 ， 


7.9.2 KRE (Critical Sections) 
— Ec p — 1 COE e Fa i NS Ba IR TES fT SE SET BiU SB BH BR s t aic 6 B9 s BR 
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ERA di FE 。 当 程序 处 理 信号 时 ， 必须 决定 哪 一 段 代 码 为 临界 区 ,然后 没 法 保护 这 段 
代码 。 临 界 区 不 一 定 就 在 信号 处 理沙 数 中 ,很 多 出 现在 常规 的 程序 流 中 。 保 护 临 界 区 的 最 
简单 的 办 法 就 是 阻塞 或 忽略 奢 些 钼 理 薄 数 将 要 使 用 或 修改 特定 数据 的 信号。 


7.9.3 阻塞 信号 : sigprocmask 和 sigsetops 


可 以 在 信 和 导 处 理 者 一 级 或 进程 一 级 阻塞 信号。 

l. 在 信号 处 理 者 一 级 阻塞 局 号 

为 了 在 处 理 一 个 信号 的 时 候 阻 塞 另 一 个 信号 ,要 设置 struct sigaction 结构 中 的 sa_mask 
成 员 位 , 它 在 设置 处 理 阴 数 时 被 传递 给 sigaction, sa_mask 是 sigset t 类 型 , 它 定义 了 一 个 
信号 集 。 我 们 将 简要 地 解释 这 个 集合 。 

2. 一 个 进程 的 阻塞 信号 

在 任何 时 候 一 个 进程 都 有 一 些 信号 被 阻塞 。 注 意 , 是 阻塞 而 不 是 忽略 。 这 个 信号 集 就 
称 为 信号 挡 板 (signal mask), JE xf sigprocmask 可 以 修改 这 个 被 阻塞 的 信和 号 集 ， 
sigprocmask 作为 一 个 原子 操作 根据 所 给 的 信号 集 来 修改 当前 被 阻塞 的 信和 号 集 ， 








sigprocmask 
目标 修改 当前 的 信号 挡 板 
头 文件 # include «signal. h> 








函数 原型 int res = sigprocmask( int how, 
- const sigset_t * sigs, 


sigset t * prev); 


参数 how ”如 何 修改 信号 挡 板 
sigs ”指向 使 用 的 信号 列表 的 指针 
prev “指向 之 前 的 信号 挡 板 列表 的 指针 (或 为 null) 
一 1 ”失败 
0 成 功 





返回 值 





sigprocmask 修改 当前 的 信号 挡 板 设置 。 当 how 的 值 分 别 为 SIG_BLOCK SIG_ 
UNBLOCK zi SIG. SET Et, » sigs 所 指定 的 信号 将 被 添加 .删除 或 替换 。 如 果 prev 不 是 
nul] ,那么 之 前 的 信号 挡 板 设置 将 被 复制 到 * prev rp. 
3. B] sigsetops 443x842 5 3E 
一 个 sigset t 是 一 个 抽象 的 信号 集 ,时 以 通过 一 些 函 数 来 尝 加 或 删除 信和 号。 基本 的 函数 
如 下 : 


sigemptyset(sigset_t x setp) 


清除 由 setp 指向 的 列表 中 的 所 有 信号 。 


sigfillset(sigset t * setp) 
Wm BOR B fa Bl) setp 搭 向 的 列表 。 


Sigaddset(sigset t x setp, int signum) 
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添加 signum 刘 setp 指向 的 列表 。 


sigdelset(sigset t * setp, int signum! 


从 setp 指向 的 列表 中 删除 signum 所 标识 的 信和 号。 


4. 例子 ; 暂时 地 阻塞 用 户 信 号 
程序 可 以 用 以 下 代码 来 暂时 地 阻塞 SIGINT 和 SIGQUIT 信号: 


sigset t sigs, prevsigs; /* define two signal sets */ 
sigemptyset(&sigs) ; /* turn off all bits */ 
sigaddset(&sigs, SIGINT); /* turn on SIGINT bit */ 
sigaddset(&sigs, SIGQUIT); /* turn on SIGQUIT bit */ 


Sigprocmask(SIG BLOCK, &sigs, &prevsigs); /x add that to proc mask «/ 
/f .. modify data structure here. . 


sigprocmask(SIG SET, x prevsigs, NULL); /* restore previous mask x/ 


注意 这 里 是 如 何在 修改 一 个 tty 驱动 或 者 文件 描述 符 的 时 候 保存 先前 的 设置 ,然后 用 保 
存 的 设置 来 恢复 原来 的 信号 挡 板 。 除 非 目的 就 是 修改 获取 的 资源 , 否则 释放 资源 时 恢复 获 
取 时 的 状态 是 个 好 习惯 ， 


7.9.4 重 入 代码 (Reentrant Code): 递归 调用 的 危险 


打 断 别人 登记 ,而 将 自己 的 名 字 和 地址 插 在 别人 的 记录 中 间 的 例子 引信 另 一 个 与 数据 
损毁 有 关 的 概念 , 可 重信 函数 。 

一 个 信和 号 处 理 者 或 者 一 个 洱 数 ,如 果 在 激活 状态 上 能 被 调 败 而 不 引起 任何 问题 就 称 之 
为 可 重 人 的 。 

在 通过 sigaction 设置 时 ,可 以 通过 设 喷 SA NODEFER 位 米 人 允许 处 理 函 数 的 递归 调用 。 
反之 ,可 以 通过 清除 此 位 来 阻塞 信和 导 。 如 何 选择 哆 ? 

如 杂 处 理 者 不 是 可 重 入 的 ,必须 阻 宪 信和 号。 但 是 如 果 阻 塞 信 号 ,就 有 可 能 丢失 信和 号 。 信 
号 不 像 电 话 便条 那样 贴 在 那里 等 你 回 米 处 理 。 有 些 信 号 是 非常 重要 的 : 丢掉 一 些 是 安全 
的 吗 ? 

是 丢掉 信号 还 是 开 乱 数据 ”哪个 更 糟 些 ”有 没有 办 法 同时 避免 这 两 个 问题 ? 设计 使 用 
信和 上 的 程序 时 ,这 些 是 必须 考虑 的 问题 。 信 号 处 理 上 的 错误 规 象 不 很 月 规律 ,尤其 在 系统 处 
于 高 负载 的 情况 下 或 者 在 精确 的 性 能 计量 的 时 候 。 排 错 涡 要 理解 信号 处 理 的 工作 机 理 , 还 
要 知道 骂 里 可 能 会 有 问题 ，。 


7.9.5 视频 游戏 中 的 临界 区 

ARTERS LBA. MA RARER, APR PROP. aR 
HEAR. PP RAR AMER ALE R KEMAH, BEA 
个 时 刻 阻 蹇 用 户 输 入 吗 ? AAAI AR. FS RA RKB? 在 应 用 所 有 已 学 的 
知识 来 完成 视频 游戏 之 前 , 先 来 看 看 另 -- 个 信号 的 来 源 : 其 他 进程 。 
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7.40 kill: 从 另 一 个 进程 发 送 的 信号 


言 号 来 自 间隔 计时 器 ,终端 驱动 ` 内 核 或 者 进程 。 一 个 进程 可 以 通过 kill 系统 调用 向 另 
一 个 进程 发 送信 号: 














kill 
目标 向 一 个 进程 发 送 一 个 信号 
头 文件 # include — sys/1ypes. h> 
# include — signal. h> 
”函数 原型 int illCpid tipid, int sig) 
ou pid 目 MER id i 
sig 要 被 发 送 的 信号 
返回 什 一 1 X 
0 成 功 


kill 向 一 个 进程 发 送 一 个 信号 ,发 送信 号 的 进程 的 用 户 ID 必须 和 目标 进程 的 用 户 TID 
相同 ,或 者 发 送信 号 的 进程 的 拥有 者 是 一 -个 超级 用 户 。 一 个 进程 可 以 向 自己 发 送信 号。 

一 个 进程 可 以 向 其 他 进程 发 送 任 何 信 息 , 包 括 一 般 来 自 键盘 .间隔 计时 器 或 者 内 核 的 信 
号 。 比 如 一 个 进程 可 以 向 另 一 个 进程 发 送 SIGSEGV 信号 ,就 好 像 目 标 进程 执行 了 非法 内 存 
读 取 。 

Unix 命令 kill 使 用 kill 系统 调用 (如 图 7.17 BOR. 











图 7.17 一 个 进程 合用 kill() 来 发 送信 息 


|. SEAR fup uf 45 45 5-50 

接受 信号 的 进程 几乎 可 以 设置 任何 信号 的 处 理 者 。 考 虑 一 下 在 收 到 SIGINT 叶 就 打印 
OUCH! 的 程序 。 如 果 其 他 进程 向 OUCH! 程序 发 送 SIGINT X info? OUCH! EH 
会 捕获 信号 , 跳 转 到 处 理 者 ,打印 OUCH1 (如 图 7.18 ffm). 

更 进一步 ， 如 果 第 一 个 程序 设置 一 个 间 申 计时 器 ,计时 器 的 信和 号 处理 函数 向 OUCH! 
程序 发 送 SIGINT 信号。 这 样 相应 的 处 理 落 数 就 被 调用 。 从 页 一 个 进程 的 计时 器 控制 了 另 
一 个 进程 的 函数 调用 、 实 际 上 ,一 组 进程 可 以 像 橄 攀 球 运动 员 传递 橄 榴 球 那 样 传递 信号 。 
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图 7.18 信号 的 复杂 用 法 


2. IPC 信号 设计 ; SIGUSRI,SIGUSR2 

Unix 有 两 个 信号 可 以 被 用 户 杷 序 使 用 ， 它 们 是 SIGUSR] 和 SIGUSR2。 这 两 个 信号 没 
有 预定 义 任务 。 可 以 使 用 它们 以 避免 使 用 已 经 有 预定 义 语义 的 信号。 

将 在 后 面 几 章 学 习 进 程 辣 道 信 。 编 程 时 可 以 有 很 多 方法 组 合 使 用 kil 和 sigaction。 


7.11 ERI BIS: 视频 游戏 
现在 回 到 视频 游戏 。 游戏 有 两 个 主要 元 素 : 动画 和 用 户 输 人 。 动 画 要 平滑 ,用 户 第 人 会 
改变 运动 状态 。 下 一 个 程序 bounceld.c 让 用 户 可 以 将 字符 串 在 屏幕 上 弹 来 阐 去 。 
7.11.1 bounceld.c: 在 一 条 线 上 控制 动画 


; 首先 来 看 看 bounceld 看 上 去 是 什么 样子 。 界 面 如 图 7. 19 AR. bounceld, c 将 一 个 单 
词 平 滑 地 在 屏 舌 上 移动 。 当 用 户 按 下 空格 键 .单词 就 向 反方 向 移动 。“s" 键 和 “[”" 刍 分别 增加 
和 减少 单词 的 移动 速度 。 按 "Q"” 键 退出 程序 . 






=rellcl 


图 7.19  bounceld 的 运行 寞 面 : FR E 03] 05 22 180 


这 个 程序 是 如 何 实现 的 呢 ? 我 们 已 经 知道 如 何 实 瑞 动画 。 在 一 个 地 方 囊 一 个 字符 捉 ， 
等 几 剖 秒 ,然后 控 去 旧 的 影像 并 在 原来 位 置 的 左边 或 右边 一 个 单位 距离 重新 画 同 一 个 字符 
申 。 这 里 希望 擦 去 和 重 画 动作 以 相同 的 间隔 连续 的 进行 。 所 以 使 用 间隔 计时 器 来 涯 用 相应 
的 处 理 函 数 。 

两 个 变量 分 别 记录 移动 的 方向 和 速度 。 设置 方向 变量 的 值 为 十 1 和 一 1 分 别 表示 向 左 
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HAER. RES A ie igo fe BEAD NA € SE. EEG BS RES] ER 2E BEI GU XR E RS 
Vp ER 28 BER BO SERE 

Jt (0) 2 FR PPro FU ED P bl. AREE P 00 8 A A, E PICO Oe RU ER. BFH 
逻辑 如 图 7.20 所 示 。bounceld 体现 了 两 个 重要 的 技术 ; 状态 变量 和 事件 处 理 。 记 录 位 置 、 
方向 和 延 时 的 变量 定义 了 动画 的 状态 。 用 户 输 人 和 计时 器 信号 是 改变 这 些 状态 的 事件 。 每 
次 计时 器 到 达 信 号 就 调用 改变 位 置 的 处 理 函 数 。 每 次 得 到 用 户 键盘 输入 信号 就 油 用 改变 方 
向 和 速度 变量 的 代码 。 以 下 是 它 的 代码 。 

流 到 信号 处 理 
正常 的 控制 流 ”函数 再 返回 ”状态 变量 


col dir 


E111 


—, On tickor() 








ED 7.20 用 户 输入 改变 变量 值 而 变量 值 控制 动作 


/* bounceld.c 
* purpose animation with user controlled speed and direction 
* pote the handler does the animation 
* the main program reads keyboard input 
* compile CC bounceld.c set ticker.c -l curses - o bounceld 


ay 

#unclude <stdio.h> 
# include <(curses. h> 
H include “signal. h> 


/* some qlobal settings main and the handler use »/ 


H define MESSAGE "hello" 


H define BLANK " P 
int row; /x current row */ 
int col; /# current column ~” 
int dir; /»* where we are going */ 
int matta 
{ 
int delay; "bagger =~ aawer «/ 


int ndelay; . * new delay a; 
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int c; /* user input */ 


void | move msg(int); /x handler for timer */ 


initscr(); 


crmode(); 

noecho() ; 

clear(); 

row = 10; /* start here +/ 

col = 0; 

dir = 1; /* add 1 to row number */ 
delay - 200; /* 200ms = 0.2 seconds «/ 
movetrow,col); /* get into position x/ 
addstr( MESSAGE) ; /* draw message «/ 


signal(SIGALRM, move msg; 
set ticker( delay }; 


whiletl) 
1 
ndelay = 0; 
c = getchO; 
if (c = 二 'Q') break; 
if (c == '') dir = -dir; 
if qe == 'f'&&k delay > 2 ) ndelay = delay/2; 
if (c == 's'j ndelay = delay * 2; 


if ( ndelay — 0 ) 
set ticker( delay = ndelay ); 
} 
endwin(); 


return 0; 


void move msg(int signum) 


i 


Signal(SIGALRM, move msg); /x reset, just in case «/ 
move( row, col ) ; 
addstr( BLANK ) ; 


col + = dir; /* move to new column */ 
move( row, col ); /* then set cursor «/ 
addstr( MESSAGE ), /* redo message x/ 
refresh(); /* and show it +/ 
fm 

* now handle borders 

af 


if (dir == -1 &&col <= 0) 
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dir = 4; 
else if ( dir == 1 && col + strlen( MESSAGE) >= COLS ) 
dir = —}; 


} 


| 递归 还 是 阻 宣 : 一 个 真实 的 例子 

在 学 习 信 号 处 理 函 数 的 数据 损毁 时 提 到 过 重 人 琐 数 ，bouneelid 提供 了 一 个 考察 这 个 问 
题 的 真实 例子 。 开 始 时 信和 号 处 理 函 数 move msg 每 秒 钟 被 湖 用 5 次 。 按 “f” 键 来 减 小 计时 器 
延 时 以 增加 动画 速度 。 如 杂 按 很 多 次 “f”" 键 ,两 次 计时 器 消息 之 间 的 间 隐 可 能 比 一 次 处 理 函 
数 的 执行 时 间 还 要 短 。 如 果 计 时 器 消息 在 处 理 函 数 忙 于 擦 去 和 重 画 字符 串 时 到 达 又 会 如 何 ? 

这 个 问题 的 分 析 留 作 习 题 。 在 这 个 程序 中 使 用 signal, 到 底 是 递归 还 是 阻塞 依赖 于 你 的 

2， 下 一 步 做 什么 ? 

如 何 扩展 bounceld 为 一 个 弹 球 游戏 ?首先 ,要 用 "O"” 米 替换 "hello”, 因 为 "*O" 更 像 一 个 
Ek. Ra ,要 让 球 在 左右 移动 之 外 还 可 上 下 移动 。 为 了 增加 上 下 移动 的 能 力 要 深 加 状 态 变 
景 。 现 在 已 经 有 col 和 row 来 记录 球 的 位 置 ,dir 来 记录 水 平移 动 方向 。 如 果 要 使 球 能 上 下 
Tb x KERMA Ee? 


7.11.2 bounce2d.c: 两 维 动画 


程序 bounce2d 产生 两 维 的 动画 ,可 以 让 用 户 控制 水 平 速度 和 垂直 速 庶 ,如 图 7.21 所 示 。 





减速 “加速 


7,21 两 维 动画 


bounce2d 的 3 个 设计 部 分 与 bounceld 相同 ， 

(1) 计时 器 驱动 

[81 P T p 28 x Ur EDU 67 ^E EE ] SIGALRMS 优 号 流 。 响 应 一 个 信号 , 球 向 前 移动 
一 步 。 
(2) 等 待 键盘 输入 
程序 阻塞 等 待 键盘 输 入 。 根 据 用 户 按 下 的 键 的 不 同 采 玛 不同 的 动作 。 
(3) 状态 变量 
变量 记录 了 球 的 速度 和 和 方向。 用户 输 和 人 修改 的 变量 值 决 定 了 小 球 的 速度 。 计时 器 处 理 
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函数 根据 速度 和 位 置 变量 来 决定 在 何 时 何 处 即 小 球 。 

看 起 来 都 很 像 bouneeld。 但 这 里 有 一 点 不 同 ,这 是 一 个 重要 的 问题 : 如 何 计 球 斜 着 
EE zh? 

让 球 斜 着 移动 是 一 个 新 间 题 。 在 一 维 的 程序 中 ,等 个 计时 器 信和 号 促使 影像 在 屏幕 上 移 
动 一 个 单位 。 这 样 就 很 简单 ; 一 个 信和 号 .~ 个 单位 。 但 是 在 两 维 的 动画 中 ,情况 就 水 这 人 么 简 
单 了 。 考 虑 一 下 图 7. 22 所 示 的 路 径 。 这 种 情况 下 ,每 垂直 移动 一 个 单位 ,水 平移 动 3 个 单 
位 。 一 种 方法 是 在 收 到 每 个 计时 器 信号 时 将 影像 从 A 移动 到 了 3。 当 两 个 直 章 边 成 一 定 比例 
时 ,影像 的 跳跃 可 能 比较 大 。 比 如 当 上 比例 为 3/4 时 每 次 跳 族 达到 5 个 单位 。 


问题 : Mf] EOF A A 
动 到 单元 B? 














图 7.22 直角 边 之 比 为 1/3 的 移动 路 径 


每 次 移动 一 个 单位 看 起 来 比较 好 。 当 坦 第 边 的 比 为 1/3 的 时 候 , 影 像 如 图 7.23 那样 一 
个 单位 一 个 单位 的 移动 。 注 意 , 影 像 每 横向 移动 3 个 单位 纵向 就 移动 一 个 单位 。 横 向 移动 的 
步 数 是 纵向 移动 步 数 的 3 倍 。 

这 样 看 起 来 像 有 两 个 计时 器 。 考 虑 只 有 一 个 计时 家 。 每 隔 两 个 时 钟 信号 影像 向 右 移动 
- 个 单位 。 BS 个 时 钟 信号 程序 将 影像 向 上 移动 一 个 单位 。 这 样 球 就 会 斜 着 移动 。 如 果 
时 钟 间隔 单位 分 别 为 10 和 30 的 话 ,那么 球 移动 的 路 径 要 同 ,就 是 慢 些 。-- 个 称 序 只 有 一 个 
真实 的 间隔 计时 器 ,所 以 要 构造 两 个 自己 的 计时 器 。 这 两 个 自己 的 计时 器 是 由 真实 的 间隔 
计时 器 驱动 。 这 里 采用 图 7.23 所 示 的 逻辑 来 驱动 两 维 动画 。 


为 了 模拟 对 角 线 移动 ,需要 

每 两 个 计时 器 信号 向 太 移 动 一 个 单位 ,每 六 个 
计时 器 信号 向 上 移动 一 个 单位 。 

这 种 的 技术 需 材 两 个 计时 器 。 一 个 记录 不 平 
移动 的 计时 内 信和 号 数 , 一 个 记录 垂直 稳 动 的 计 
时 器 信 导 数 。 





图 ?7,23 每 次 移动 一 个 单位 更 好 


为 了 能 同时 在 两 个 方向 移动 ,用 两 个 计数 器 来 充当 计时 器 。 就 像 系统 的 间 昭 计时 器 由 
两 部 分 组 成 一 样 ,每 个 计数 器 都 有 两 个 属性 : 当前 值 和 间隔 。 当 前 值 表示 在 下 次 重 画 之 前 还 
训 等 待 多 少 个 计时 信和 号。 间隔 指 明 两 次 移动 之 间 所 要 等 待 的 计时 信号 个 数 。 两 个 成 员 变 量 
分 别 命名 为 ttg 和 ttm。 代 码 如 下 : 


/* bounce2d 1.0 


* bounce a character (default is '9') around the screen 
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* defined by some parameters 


* 


* user input. s slow down x component, S, slow y component 


* 


* 


* 


f speed up x component, F; speed y component 


Q quit 


* blocks on read, but timer tick sends SIGALRM caught by ball move 


* build; cc bounce2d.c set ticker.c — lcurses - o bounce2d 


x/ 


H include «curses, h> 
f include «signal. h> 
d include "bounce. h" 


struct ppball the ball ; 


/* * the main loop * x / 


void set_up(); 


void wrap up(J; 


int main() 


{ 


; 


int c; 


set upO; 


while ( ( c 7 getchar()) !- 
if(c == rfry 


g! MI 
the ball.x ttm-- 
else if (c == 's')the ball.x ttm * 


^ 


else if( c == 'F')the ball.y ttm-- ; 
else if (c == '$')the ball. y ttm t* ; 


wrap up(J; 


void set up() 
ix 


* init structure and other stuff 


{ 


*f 


void ball move(int); 


the ball.y pos 
the ball.x pos 
the ball.y ttg 
the ball.x ttg 
the ball, y dir 


Ir 


n 


Y INIT; 

X INIT; 

the ball.y ttm 
the ball.x ttm 
1; 


Y TTM ; 
X TIM 


. 
r 
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the ball.x dir = 1; 
the ball, symbol = DFL SYMBOL ; 


initscrí); 
noechot) ; 
crmode(? ; 


signal( SIGINT , SIG IGN 2; 
mvaddch¢ the ball, y pos, the ball,x pos, the ball.symbol ); 


refresh(); 


signal( SIGALRM, ball move ); 
set ticker( 1000 / TICKS,PER SECO; 
/* send millisecs per tick x/ 


} 


void wrap up() 
{ 


set ticker( Q }; 
endwin(; /* put back to normal «/ 
} 


void ball move(int signum) 


í 
1 


int y cur, x cur, moved; 


signal( SIGALRM , SIG IGN 5; /* dont get caught now */ 


y cur - the ball.y pos ; /* old spot x/ 


x cur = the ball.x pos 


r 


moved = 0; 

if ( the ball.y ttm => 0 && the ball. y ttg-- == 1 }{ 
the ball.y pos += the ball.y dir ; /* move «/ 
the ball.y ttg = the ball.y ttm; /* reset x/ 
moved = 1; 

} 

if ( the ball. x ttm > 0 && the ball.x ttg-- == 14 
the ball.x pos += the ball,x dir ; /* move ¥/ 
the ball.x ttg - the ball.x ttm; /* reset x/ 
moved = 1; 

} 

if ( moved }{ 


mvaddch( y cur, x cur, BLANK ); 

Wvaddch( y cur, x cur, BLANK 5; 

mvaddch( the ball.y pos, the ball.x pas, the ball. symbol 5; 
bounce or lose( &the ball 2; 
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movel LINES ~ 1,COLS- 1); 
refresh() ; 


H 
signal( SIGALRM, ball move); /* for unreliable systems */ 


; 


int bounce or lose(struct ppball x bp) 
1 


int return val = 0 ; 


if ( bp-7»y pos == TOP ROW | 
bp—-y dir = 1; 
return val - 1; 

} else if ( bp—7y pos == BOT ROW 2| 
bp->y dir = -1; 
return_val = 1; 

} 

if ( bp- x pos == LEFT EDGE | 

bp—-x dir- 1; 
return val = 1; 
| else if ( bp——x pos == RIGHT EDGE | 
bp—-x dir = -1; 


return val - 1; 


r 


return return_val; 


] 

头 文件 为 : 

/* bounce. h xf 

/* some settings for the game +/ 


# define BLANK + 1 

# define DFL_SYMBOL rot 

# define TOP_ROW 5 

# define BOT ROW 20 

# define LEFT EDGE 10 

S define RIGHT EDGE 70 

H define — X 1NIT 10 /* starting col x/ 
Hdefine Y INIT 10 /* starting row  »/ 

t define TICKS PER SEC 50 /* affects speed «/ 


HK define X TIM 5 
# define Y TIM B 
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/** the ping pong ball «+/ 
struct ppball 1 
int y pos, x pos, 
y ttm, x ttm, 
y ttg, x ttg, 
y dir, x dir; 


char symbol ; 


7.11.3 完成 游戏 


剩 下 的 工作 作为 练习 留 给 读者 。 需 要 添加 挡 板 控制 球 的 代码 ,将 球 从 挡 板 弹 问 的 代码 ， 
判断 球 是 否 已 经 飞 出 界 的 代码 等 。 | 

IE IE E 2603] Y Bo CR SERERE. doc RII A, A 
BARGE — A Fb fal dE COEUR FE. 想 让 计时 器 处 理 函 数 设计 成 递归 调用 的 ,还 是 阻塞 后 
面 的 信号 ? 


7.12 输入 信和 号: 异步 1/O 


本 章 的 动画 和 游戏 等 待 两 类 事件 : 计时 器 信号 和 键盘 输入 。 设 置 间隔 计 时 器 的 钼 理 函 
数 来 控制 动画 ,通过 调用 getch 阴 塞 程序 以 等 待 键盘 输入 。 除 了 阻塞 ,还 能 像 得 到 计时 器 信 
EHE ROB SESS RS AAP 069 AS? 

可 以 的 。 程 序 可 以 要 求 内 核 在 得 到 输入 时 发 送信 号 。 这 有 点 像 要 求 邮递 员 在 投递 邮件 
RTH]. SARA ABA AIBA SMES FHA ie ABR a. TERI 
Bt eR — A (8 Bl RE AB A 

Unix A Bit 5 26 fi A (asynchronous input) 系 统 ， 一 种 方法 是 当 和 输入 就 绪 时 发 送信 号， 
另 一 个 系统 当 输 入 被 读 和 时 发 送信 号 。UCBH 中 通过 设置 文件 描述 块 (file descriptor) £9 O - 
ASYNC 位 来 实现 第 一 种 方法 。 第 二 种 方法 是 POSIX 标准 , 它 调用 aio_read。 下 面 将 学 习 这 
两 种 方法 。 首先 ,来 在 看 这 人 么 做 的 想法 。 


7.12.1 使 用 异步 I7O 


新 版 本 的 反弹 程序 如 图 7. 24 上 所 示 。 需 要 两 种 信号 ， SIGIO 和 SIGALRM, ,所 以 要 建立 
两 个 处 理 函 数 。SIGIO 处 理 函 数 读 人 击 键 并 根据 读 人 的 数据 采取 行动 。SIGALRM AES EI 
数 驱 动 动画 并 检测 碰撞 。 为 简单 起 见 , 去 掉 了 速度 控制 。 


7.12.2 方法 1: (B FH O ASYNC 











使 用 O ASYNC 需要 对 原 有 的 弹 球 程序 做 4 外 改动 。 首 先 要 建立 和 设置 在 键盘 输入 时 
说 调用 的 人 处理 泪 数 。 其 次 ,使 用 fcntl ff F SETOWN 命令 来 告诉 内 核发 送 答 和 通知 信号 给 
进程 。 其 他 进程 可 能 也 连接 到 键盘 。 这 里 不 想 让 这 些 进 程 发 送信 和 号。 第 三 ,通过 洞 用 fcntl 


第 ?7 章 SAAR: 编写 一 个 视频 游戏 "219 ， 











图 7. 24 


col dir data 
Ss 


on input() 





键盘 和 计时 器 部 发 送信 号 


来 设置 文件 描述 符 0 中 的 O_ASYNC 位 来 打开 得 人 信和 号。 最 后 ,循环 调用 pause 等 待 来 自 计 
时 器 或 键盘 的 信号 、 当 有 一 个 从 键盘 来 的 字符 到 达 , 内 核 向 进程 发 关 SIGIO f 3. SIGIO 
的 处 理 蜗 数 使 用 标准 的 curses MH getch 来 读 人 这 个 字符 。 当 计时 器 同 隔 超时 ， 内 核发 送 以 
前 已 经 处 理 的 SIGALRM 信和 号。 以 下 是 源 代码 : 


/* bounce async.c 
animation with user control, using 0 ASYNC on fd 
set ticker() sends SIGALRM, handler does animation 


* purpose 
* note 

E 

* compile 
*/ 

§ include 
# include 
# include 


4 include 


keyboard sends S1610, main only calls pause() 
CC bounce async.c set ticker.c — 1 curses - o bounce async 


<stdio.h> 
<(curses. h> 
<signal, h> 
<fentl. h> 


/* The state of the game "/ 


Ë define 
# define 


int row 
int col 
int dir 
int delay 


int done 


mand ) 


| 


void 


MESSAGE “hello” 
BLANR ta 


= 10; 


on alarm(int); 


/* current row */ 
/x current column  «/ 
/* where we are going «/ 


/* how long to wait «/ 


/x handler for alarm «/ 
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void on input(int); /* handler for keybd */ 
void enable kbd signals(); 


} 


initser(); 
crmode() ; 
noecho() ; 


clear(); 


signal{SIGIO, on input); 
enable kbd signals(); 
signal(SIGALRM, on alarm); 
set ticker(delay); 


move(row,col); 
addstr( MESSAGE ); 


while( ! done ) 
pause(); 
endwin{) ; 


void on input(int signum) 


1 


int c = getch(); 


if(c == ‘QO? || e == EOF) 


done = 1; 
may 


else if (c == 


dir = - dir; 


void on alarm(int signum) 


{ 


Signal(SIGALRM, on alarm); 


mvaddstrí( row, col, BLANK J; 


col += dir; 


/* 


/* 
fx 
/* 
fs 
ix 
pE 


/* 


fs 
da 


mvaddstr( row, col, MESSAGE ); fx 


refresh(); 


fx 


fn 

* now handle borders 

xf 

if ( dir == -1&&coi <= 0) 
dir = 1; 


r 


set up screen */ 


install a handler x/ 
turn on kbd signals */ 
install alarm handler */ 
start ticking x/ 


get into position x/ 


draw initial image */ 


the main loop «/ 


grab the char «/ 


reset, just in case */ 
note mvaddstr() «/ 
move to new column x/ 
redo message x/ 


and show it */ 


else if (dir == 1 && col + strlen(MESSAGE) >= COLS ) 


dir = -1; 
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ix 
x install a handler, tell kernel who to notify on input, enable 


* Signals 
x/ 
void enable kbd signalsi) 
{ 
int fd flags; 


fcntl(0, F SETOWN, getpid(2); 


fd flags = fontl(d, F GETFL); 
fcntl(0, F SETEL, (fd flags|O ASYNC)); 


7.12.3 AŽ 2. (B FH aio read 
TH E Ux EIC RAR AY O_ASYNC 位 ,使 用 ajo read 更 加 灵活 ， 当然 也 复杂 些 。 对 原来 


的 弹 球 程 序 做 4 处 改动 。 
- 第 一 ,设置 输 人 被 恋人 时 所 调用 的 姓 理 了 欧 数 on. input. 

第 二 ,设置 struct kbebuf 中 的 变量 来 指明 等 待 什么 类 型 的 输 人 , 当 输入 发 生 时 产生 什么 
信号 。 在 这 个 简单 的 程序 中 ,需要 从 文件 描述 符 0 中 读 人 ~- 个 字符 , 当 字符 被 读 和 人 时 希望 收 
到 SIGIO 信和 号。 实际 上 能 指定 任何 信号 , 甚 全 是 SGARLM 或 SIGINT。 

第 三 ,通过 将 以 上 定义 的 结构 体 传 给 alo read 来 递交 读 入 请 求 。 和 调用 一 般 的 read 不 
同 ,aio_read ^F EE SE ERE. HX. aio read 会 在 完成 时 发 送信 号 。 

现在 这 个 程序 可 以 做 任何 它 想 做 的 事情 了 。 在 下 面 这 个 简单 的 例子 中 ,只 是 调用 pause 
来 等 待 信号 。 当 用 户 得 人 字符 ,aio_read 向 进程 发 送 SIGIO 信号 ,响应 处 理 函 数 被 调用 。 

最 后 ,实现 处 理 函 数 ,函数 通过 调用 aio return 来 得 到 输入 的 字符 。 然 后 外 理 这 个 字符 。 


/* bounce_aio.c 
+ purpose animation with user control, using aio read() etc 
* note set ticker() sends SIGALRM, handler dces animation 
* keyboard sends SIGIO, main only calls pause() 
* compile cc bounce aio.c set ticker.c —- lrt -1 curses ~ o bounce aio 
af 
# include <<stdio.h> 
# include < curses. h> 
# include < signal. h> 


d include aio. h> 
/* The state of the game x/ 


4t define MESSAGE "hello" 
3t define BLANK  " " 


int row - 10; /* current row */ 
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int col s Ü; 
int dir = 1; 
int delay = 200; 
int done = 0; 


struct aiocb kbcbuf ; 


main() 


] 


1 


t 
fe 


void on alarm(int); 


void on input(int); 


void setup aio buffer(); 


initser(); 
crmode() ; 
noechoQ ; 


clear():; 


signal(SIGIO, on input); 
setup aio buffer(); 
aio read(&khcbuf); 


signal(SIGALRM, on alarm); 
set ticker(delay); 


mvaddstr( row, col, MESSAGE ) ; 


Whiler ! done ) 
pauset?; 
endwin(); 
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/* current column */ 
/* where we are going */ 


/* how long to wait */ 


/* an aio control buf */ 


/* handler for alarm x/ 


/* handler for keybd #/ 


/* set up screen «/ 


/* install a handler x/ 
/* initialize aio ctrl buff x/ 


/* place a read request */ 


/*install alarm handler */ 
/* start ticking 


/* draw initial image */ 


/* the main loop x/ 


* handler called when aio read() has stuff to read 


* First check for any error codes, and if ok, then get the return code 


*/ 


void on input() 


{ 


int c; 


char * cp = 


/* check for errors */ 


if ( aio error(&kbcbuf) != 0) 


perror( "reading failed'); 


else 


/* get number of chars read x/ 


(char * ) kbcbuf.aio buf; /x cast to char * #/ 


if ( aio return(&kbebuf) == 1) 


f 
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c= *Cp; 

ifi == +Q! || e == EOF} 
done = 1; 

else if (c == '1) 
dir = - dir; 


/* place a new request */ 
aio read(Skbcbuf); 


void on alarm() 


1 


Signal(SIGALRM, on alarm); 
mvaddstr( row, col, BLANK 2; 
col += dir; 
mvaddstr( row, col, MESSAGE ); 
refresh(}; 
/* 

x now handle borders 

x/ 

if (dir == -1&& col <= 0) 

dir = 1; 


H 


/* reset, just in case «/ 
/* clear old string */ 
/* move to new column x/ 
/* draw new string */ 


/* and show it x/ 


else if ( dir == 1 && col + strlen(MESSAGE) >= COLS ) 


dir = —-1; 
} 
/* 


* set members of struct. 


* First specify args like those for read(fd, buf, num) and offset 
* Then specify what to do (send signal) and what signal (SIGIO) 


a 
void setup aio buffer() 
4 
static char input| 1]; 
/* describe what to read x/ 


kbcbuf.aio fildes -0; 
kbcbuf.aio buf = input; 
kbcbuf.aio nbytes = 1; 
kbebuf.aio offset = 0; 


/* 1 char of input «/ 


/* standard intput «/ 
/* buffer «/ 

/* number to read */ 
/* offset in file «/ 


/* describe what to do when read is ready x/ 


kbcbuf.aio sigevent.sigev notify 


kbcbuf.aio sigevent.sigev signo 


SIGEV SIGNAL; 
SIGIO; /x send sIGIO x/ 
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7.12.4 弹 球 程序 中 需要 异步 读 入 吗 


不 。 用 户 输 人 阻塞 程序 ,间隔 计时 器 驱动 球 移动 的 模式 工作 的 很 好 。 异步 读 人 的 优势 
在 于 程序 不 用 被 输入 阻塞 而 可 以 做 些 其 全 什么 。 

比如 一 个 更 有 想象 力 的 程序 可 以 用 这 段 时 间 放 音乐 .生成 声响 效果 .计算 复杂 的 背景 网 
案 , 甚 至 于 做 -- 些 公共 服务 。 越 来 越 霓 的 计算 机 贡献 出 空 闸 时 间 来 帮助 计算 数学 .大 文 学 或 
医学 领域 的 一 些 大 计算 量 的 工作 。 

弹 球 程序 可 以 用 它 的 空闲 时 间 计 算 任意 精度 的 pi 值 . 用 异步 输入 来 响应 用 户 的 键盘 答 
和 人。 对 main 中 的 循环 做 以 下 收 改 : 


改动 之 前 的 程序 : 改动 之 后 的 程序 : 
while(! done) compute pit); 
pause(); endwint); 
endwint); 


修改 后 监督 程序 调用 函数 来 计算 pifi. HIEKE T NF Rk A E R BOR A E 
MA REREH. pee I TES SERI SF, «eB EA i ch Bh FR TE IHE 
消息 ,处 理 结束 后 继续 计算 pi fft. 

如 这 个 程序 需要 用 新 的 方法 来 处 理 *Q” 键 被 按 下 的 消息 。 怎 样 修改 程 证 米 达到 这 个 日 
的 呢 ? 


7.12.5 异步 输入 .视频 游戏 和 操作 系统 


本 章 开 始 的 时 候 对 视频 游戏 和 操作 系统 做 了 对 比 。 本章 的 阐 球 游戏 不 需要 异步 输入 ， 
但 操作 系统 需要 。 内 核 要 运行 程序 而 不 能 把 时 间 浪 费 在 等 待 用 户 输入 上 。 上 内 核 设置 当 键 
盘 、 串 口 或 网 卡 得 到 输入 时 被 调用 的 处 理沙 数 。 内 核 从 一 个 运行 中 的 程序 跳 转 到 处 理 晃 数 ， 
处 理 输入 ,再 跳 回 运行 中 的 程序 。 在 莉 界 区 ,内 核 阻 塞 信号。 

内 核 的 异步 输入 是 由 硬件 实现 的 ,而 进程 的 异步 输入 是 由 软件 实现 的 。 它 们 之 间 有 
什么 联系 吗 ” 游 戏 正 在 运行 。 突 然 用 户 核 下 一 个 键 ,… 个 电子 信号 被 送 到 键盘 端口 。 键 
盘 端 口 产生 一 个 真实 的 硬件 信号 。 这 个 信号 引发 榨 制 从 视频 游戏 的 运行 中 转 到 键盘 的 设 
备 驱 动 。 

内 核 的 设备 驱动 代码 从 输入 端口 读 入 字符 ,然后 将 读 人 的 字符 通过 终端 驱动 进行 处 理 ， 
如 果 驱 动 的 文件 描述 符 被 没 置 为 异步 输入 ,内 核 向 进程 发 送信 号 。 当 进程 继续 运行 时 ,控制 
转移 到 进程 内 的 信和 号 处 理 硝 数 ， 


小 Bi 


1. 主要 内 容 
* 有 些 程序 的 控制 流 很 简单 。 而 另外 一 些 出 览 响 应 外 部 的 事件 。 一 个 视频 游戏 要 响应 
时 钟 和 用 户 输入 。 操 作 系统 也 要 响应 时 钟 和 外 设 。 
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。 curses 库 有 一 些 可 以 管理 屏幕 显示 字符 的 顺 数 。 
。 一 个 进程 通过 设 管 计时 器 来 安排 事件 。 每 个 进程 有 3 个 独立 的 计时 器 。 计 时 器 道 过 
发 送信 号 来 通知 进程 。 每 个 计时 器 都 可 以 被 设置 为 只 发 送 一 次 信号 ,或 者 按 国定 的 
间隙 发 送信 号。 
”处 理 一 个 信号 很 简单 。 朵 时 处 理 多 个 信和 号 就 复杂 些 了 。 进 程 能 决定 是 忽略 信 叶 还 是 
阻塞 售 号 。 进 种 能 够 告知 内 核 哪 些 信号 在 什么 时 候 阻塞 或 忽略 。 
> 有些 丽 数 执行 一 些 复 灯 的 任务 是 不 能 被 打 断 的 ,程序 可 以 通过 小 心地 使 用 售 呈 掩 码 
来 保护 这 些 临 界 区 代码 。 
2. 进一步 的 问题 
本 章 中 ,了 解 到 视频 游戏 是 如 何 通 过 接收 和 和 处理 信 和 号 来 同时 做 几 件 事情 的 。Unix 同时 
运行 儿 个 程序 。 进 程 是 如 何 送 行 的 ? 进程 来 自 何 处 ? 下 面 将 注意 力 从 操作 系统 的 基本 概念 
和 原则 转 到 如 何 创 建 进程 .如 何在 进程 间 通 信 这 些 细节 上 。 


3. 
7.1 


7.3 


7.6 


习题 


pause 等 竺 任何 信号 的 到 达 , 包 括 从 键盘 生成 的 信号 ,比如 SIGINT. 
OD 运行 sleep] 然后 按 下 Ctrl-C。 会 有 什么 现象 ? HHA? 

(2) 修改 sleep] 以 处 理 SIGINT., 

(3) 再 运行 程序 , 按 下 Ctrl-C 又 会 如 何 ? WHA? 


在 有 些 情况 下 , 慢 速 设备 (Slow Devices) lf] read 系统 调用 可 以 被 中 断 。 比 如 用 户 
可 以 通过 按 下 Ctrl - C ok P BERE FE A BE EHE AL. m 59 — 6 dEESUR ,比如 程序 在 调 
用 read 从 磁盘 读 入 , 按 下 Ctrl-C 则 不 会 中 断 系 统 调用 。 

通过 读 手 册 或 者 查找 Web 来 学 习 有 关 慢 速 设备 的 知识 。 哪 些 read 的 调用 可 以 被 
"EET 哪些 不 能 ? 为 什么 ? 


sigprocmask 和 ISIG 另 一 种 方法 来 防 止 重 人 临界 区 代码 不 被 键盘 信号 打 断 的 方 
法 是 关 掉 tty 驱动 中 的 1SIG。 这 个 方法 和 在 信和 号 掩 码 上 添加 这 些 信号 有 什么 
不 同 ? 


发 明 一 种 可 重 人 的 系统 ,该 系统 文 持 人 们 到 你 的 办 公 室 来 将 他 们 的 名 字 和 地 址 登 
记 在 列表 中 。 试 给 出 一 种 算法 ,该 算法 中 入 号 处 理 函 数 在 每 次 被 调用 时 向 一 个 文 
本 文件 的 末 电 添加 3 行 数据 。 看 看 第 5 章 有 关 文 件 自动 增长 模式 (autorappend 
mode) 和 采用 link 来 锁 住 文件 的 练习 。 


讨论 如 果 bounceld. c 中 执行 move msg 一 次 的 时 间 比 计时 器 的 间隔 要 长 的 情况 
下 会 如 何 。 变 量 pos 会 如 何 ? 屏幕 会 有 什么 表现 ? 在 阻塞 和 递归 两 种 情况 下 回答 
这 些 问 题 。 有 没有 茎 不 丢失 信号 同时 又 防止 数据 损毁 的 方法 ? 


在 一 些 版 本 的 Unix 中 ,计时 器 信号 被 处 理 的 话 会 中 断 对 getch 的 调用 。 这 些 系 统 
中 被 计时 器 信号 中 断 的 getch 会 返回 EOF。 这 对 程序 有 什么 影响 ”这 些 影 响 会 产 
生 问 题 吗 ? 能 弥补 吗 ? 
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7.7 db APRA A DT (E RB BE PRÉC, 如果 SIGIO 在 程序 处 理 SIGALRM 的 
时 候 到 达 会 如 何 ? bc RA? PS RRS? 在 处 理 信号 的 
Hf BASES SOB? 递归 调用 又 如 何 ? 如 果 新 的 字符 在 程序 处 理 SIGIO 时 
到 达 会 不 会 有 问题 ? 

列 出 所 有 可 能 的 组 合 , 同 时 列 出 可 能 引发 的 问题 。 


4， 编 程 练 习 

7.8 ”有些 浏 览 器 支持 闪烁 字符 和 移动 字符 (theater-marquee text)。 修 改 hellol. c 以 显示 
关 烁 字符 。 如 果 用 户 在 命令 行 提 供 一 段 字 符 串 ,程序 应 该 显示 提供 的 字符 卓 ,否则 就 
显示 黑 认 的 字符 串 。 用 sleep 让 程序 在 打印 各 擦 除 宇 符 串 之 间 停 顿 。 


7.9 使 用 curses 来 实现 移动 字符 效果 ,并 用 这 个 效果 显示 一 个 文件 的 内 容 。 移 动 字符 
效果 (Theater Marquee) (或 者 传动 带 效 果 Ticker Tape) 是 在 一 个 水 平 区 域 中 水 平 
MAS HR EES. BMRB MOA PEA REAM ER AH KE, 
位 置 及 速度 。 l 


7.10 修改 hello5.c, 用 usleep 来 替代 sleep 26 E — THE BF AA A Be ay b b hh (81 (al 
CICE 
修改 程序 使 字符 串 在 屏幕 两 边 移 动 变 慢 ,而 到 中 间 就 移动 加 快 。 看 看 程序 产生 
的 轨迹 能 多 接近 单 摆 或 弹 短 上 的 物体 的 简 谐 振动 的 轨迹 。 
想象 屏幕 的 右边 是 行星 ,字符 帅 从 太空 藩 下。 修改 程序 使 之 能 模拟 重力 的 加 速 作 
用 。 可 以 做 的 更 加 真实 些 , 在 字符 串 擅 击 地 而 时 碎 裂 成 四 处 飞溅 的 小 字符 。 


7.11 程序 ticker demo. c 从 信号 处 理 函 数 退 出 。 能 和 否 修 改 程序 使 之 从 main eR CB HI 
而 不 是 信号 处 理 函 数 。 添 加 一 个 名 为 done 的 全 局 变量 。 然 后 对 原来 的 程序 再 微 
两 处 修改 使 之 能 从 main 退出 。 两 种 方法 的 利弊 各 是 什么 ? 


7.12 修改 sigdemo3. ce, 把 两 个 信和 吕 处 理 琐 数 台 并 成 一个。 地 合并 后 的 处 坦 晤 数 中 通 
过 检查 参数 来 判断 是 什么 类 型 的 信号 触发 处 理 函 数 的 调用 。 这 -… 改 动 会 对 程序 
的 行为 有 何 影响 ? 


7.13 你 有 连 到 远 端 机 器 ,然后 忘 了 退出 的 经 历 吗 ? 一 个 后 台 运 行 的 程序 在 一 定 的 空 

闲 时 间 后 向 登录 命令 解释 进程 发 送 SIGKILL 消息 会 很 有 用 。 

(1》 写 程序 imeout. c。 这 个 程序 接受 命令 行 参数 包括 进程 ID APR, PRI 
定 的 秘 数 后 向 指定 的 进程 发 送 SIGKILL 信号。 可 以 从 命令 解释 进程 用 timeout 
ss 3600 .命令 来 启动 程序 。 符 号 $$ 表示 命令 解释 进程 的 ID. 

(2) timeout. c 的 问题 是 一 个 小 时 以 后 就 算 你 还 在 工作 它 还 是 会 让 你 退出 。 修 改 
程序 使 之 只 在 你 的 ty 没有 输 人 /输出 10 分 钟 以 后 才 退 出 , GER: /dev/ 
ttyxx 的 修改 时 间 代 表 了 最 后 一 次 从 设备 读 人 或 写 出 数据 的 时 间 。 人 修改 程序 
便 之 能 够 以 参数 的 形式 接受 tty HA.) 


7. 14 


7, 15 


Aly 
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在 本 练习 中 将 写 一 个 程序 在 用 户 层 模拟 图 7. 14 演示 的 情况 。 说 明 如 何 由 一 个 实 
B E] Bp SE SH BRA AS IRL RS FEET RS a 
首先 ,基于 sigdemol.c 写 一 个 名 为 ouch. c 的 程序 。 也 就 是 第 6 BPH OUCH 
EF. ouch 将 从 命令 行 接 受 两 个 参数 。 一 个 是 信号 处 理 范 数 要 打印 的 字符 
串 , 另 一 个 是 信号 处 理 函 数 在 打印 之 前 要 被 调用 的 次 数 。 比 如 命令 : 

$ ouch hello 10 & 
将 在 后 台 运 行程 序 ,程序 每 收 到 10 次 SIGINT 信号 打印 一 次 hello。 
然后 写 一 个 节拍 程序 ,并 命名 为 metronome, c。 这 个 程序 从 命令 行 接受 -一 个 进程 
ID 列表 . 程序 用 间隔 计时 器 来 生成 间隔 为 1 秘 的 SIGALRM 信和 号。 处 理 函 数 利 
用 kill 系统 调用 向 指明 的 进程 发 送 SIGINT fg. màn: 

$ metronome 1 3456 7777 2345 
将 每 隔 1 秒 钟 向 ID 为 3456.7777 和 2345 的 进程 发 送 SIGINT 信和 号。 
在 后 台 启 动 3 个 ouch 实例 的 进程 。 给 每 个 进程 不 同 的 消息 字符 串 利 间 孙 。 然 后 记 下 
它们 的 DD。 最 后 以 1 和 那些 进程 的 一作 为 参数 来 启动 metronome 程序 。 


用 uslcep() 来 阻塞 程序 ,用 处 理 函 数 来 处 理 输入 在 bounceld. c 中 主 循 坏 在 
getch 被 阻塞 , 傍 号 处 理 函 数 来 控制 动画 。 基 于 hello5. c 的 机 制 重 写 bounceld. 
c。 在 新 的 版 本 中 用 户 输入 和 动画 的 角色 将 被 调换 ,也 就 是 说 主 循环 在 调用 
usleep 被 阻塞 ,程序 在 信号 处 理 函 数 中 处 理 用 户 输入 。 


写 一 个 测试 用 户 的 反应 速度 的 程序 。 牺 序 等 待 一 个 随机 的 间隔 时 间 然 后 在 屏幕 
上 打印 一 个 一 位 十 进 制 数 字 。 用 户 变 在 尽 可 能 短 的 时 间 内 输入 这 个 数字 。 程 序 
记录 用 户 的 反应 速度 。 程 序 进行 10 次 这 样 的 测试 然后 报告 最 慢 、 最 快 和 平均 响 
MEL. ER: 看 看 gettimeofday 的 用 户 手册 》 


完成 本 章 开 始 描 述 的 弹 球 游戏 。 添 加 分 数 、 多 用 户 、 缓 冲 器 和 其 他 任何 能 想到 的 
使 游戏 变 得 好 玩 的 机 制 。 





5. 项 目 
基于 本 章 学 习 的 知识 ,能 够 实现 以 下 的 几 个 Unix 程序 了 : 


snake, worms 
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概念 与 技巧 

* Unix shell 的 功能 
* Unix 的 进程 模型 
+ 如 何 执 行 一 个 程序 
”如 何 创 建 一 个 进程 
© 父 进程 和 子 进 程 之 间 如 何 遂 信 
相关 的 系统 调用 

» fork 

* exec 

* wait 

* exit 

相关 命令 

* sh 

* ps 


8.1 进程 三 运行 中 的 程序 


Unix 是 如 何 运行 程序 的 ? 这 看 起 来 很 容易 ; 首先 登录 ,然后 shell 打印 提示 符 , 输 人 命 
令 并 按 回 车 键 。 程 序 立 即 就 开始 运行 了 。 当 程序 结束 后 ,shell 打印 一 个 新 的 提示 符 。 但 这 
些 是 如 何 实现 的 呢 ? 什么 是 shell? shell 做 了 些 什 么 呢 ? 内 核 又 做 些 什么 ? 程序 是 什么 ” 运 
行 一 个 程序 意 昧 着 什么 ? 

一 个 程序 是 存储 在 文件 中 的 机 器 指令 序列 。 一 般 它 是 由 编译 器 将 源 代 码 编 译 成 二 进 制 
格式 的 人 代码。 运行 一 个 程序 意味 着 将 这 个 机 器 指令 序列 载 人 内 存 然后 让 处 理 器 (CPU} 逐 条 
执行 这 些 指令 ，。 

在 Unix 术语 中 ,一 个 可 执行 程序 是 一 个 机 器 指令 及 其 数据 的 序列 。 一 个 进程 是 程序 运 
行 时 的 内 存 空间 和 设置 ， 图 8.1 显示 了 程序 和 进程 。 


H&M 进程 和 程序 : 编写 命令 解释 器 sh « 229 。 








图 8.】 REPRENE 


数据 和 程序 存储 在 磁盘 文件 中 ,程序 在 进程 中 运行 。 以 下 的 儿童 里 将 学 习 进 程 概 念 . 
从 命令 ps 和 sh 开始 ,然后 写 一 个 自己 的 Unix shell, 


8.2 通过 命令 ps 学 习 进 程 


进程 存在 于 用 户 空间 。 用 户 空 间 是 存放 运行 的 程序 和 它们 的 数据 的 一 部 分 内 存 空 间 。 
如 图 8.2 所 示 , 可 以 通过 使 用 psCprocess status 进程 状态 的 简写 ) 命 令 来 查看 用 户 空间 的 内 
容 。 这 个 命令 会 列 出 当前 的 进程 ，。 


用 户 空间 R 
容纳 进程 
ps -a 
ps-l 





义 件 系统 容纳 


文件 和 目录 
l5 -5 
Is-l 
图 8.2 ps 命令 列 出 当前 进程 

$ ps 
PID TTY TIME CHD 
1775 pts/\ 00:00:17 bash 
1981 pts/) 00:00:00 ps 


这 里 有 两 个 进程 在 运行 : bash(shell) 和 ps 命令 。 每 个 进程 都 有 一 个 可 以 惟一 标识 它 的 
数字 , 鹤 确 为 进程 ID。 一般 简称 为 PID。 每 个 进程 郁 与 - -个 终端 相连 ,这 里 是 /dev/pts/1。 
每 个 进程 都 有 一 个 已 运行 的 时 间 。 广 意 ps 对 已 运行 时 间 统 计 并 不 是 非常 的 精确 ,从 ps 只 用 
了 0 秒 就 可 以 看 出 ， 

ps 有 很 多 可 选项 。 和 ls 命令 一 样 ,ps 支持 ~a 可 选项 ， 
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$ ps-a 

PID TTY TIME CMD 
1779 pts/0 00:00:13 gv 
1780 pts/O 00:00:07 gs 
1781 pts/O  00;00:01 vi 
2013 pts/2 00:00:23  xpaint 
2017 pts/2  00:00.02 maii 
2018 pts/1 00:00:00 ps 


-a 选项 列 出 所 有 进程 ,包括 在 其 他 终端 由 其 他 用 户 运 行 的 程序 。 但 是 带 选 项 -a 的 输 
出 并 不 包括 shell. ps 也 有 一 个 -1 选项 来 打印 更 多 细节 : 


$ ps ~ la 

F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CHD 
000 S 4504 1779 1731 D 69 Ò = 1086 do sel  pts/0 00:00:13 gv 
000 S 504 1780 1779 0 689 0 = 2309 do sel pts/0 00:00:07 gs 
000 S S504 1781 1731 0 72 0 二 1320 do sel pts/0 00:00:01 vi 
000 S 519 2013 1993 0 69 I9. -= 1300 do sel pts/2 00;00:23 xpain 
000 S 519 2017 1993 0 $89 D = 363 read c pts/2 00;80;02 mail 
000 R 500 2023 1755 0 378 0 一 750 一 pts/1 00:00:00 ps 


名 为 5 的 一 列表 示 各 个 进程 的 状态 。S 列 的 值 为 尺 说 明 ps 对 应 的 进程 正在 运行 。 其 他 
进程 的 S 列 值 都 是 S, 说 明 它 们 都 处 于 睡眠 状态 。 每 个 进程 都 属于 相应 的 由 UID 列 指明 的 
用 户 ID。 每 个 进程 都 有 一 个 进程 DCD , 间 时 也 有 一 个 父 进程 IDCPPID)， 

标记 为 PRl 和 NI 的 列 分 别 是 进程 的 优先 级 和 niceness 级 别 。 内 核 根 据 这 些 值 来 决定 
什么 时 候 运 行进 程 。 一 个 进程 可 雇 增 加 niceness 级 别 , 这 就 像 在 超市 里 在 排队 付 账 的 时 候 
让 其 他 客户 排 到 自己 的 前 面 。 超 级 用 户 可 以 减少 他 的 niceness 级 别 , 这 就 像 排队 的 时 候 
插队 ， 

一 个 进程 有 大 小 ,这 由 SZ 列表 示 。 这 列 的 数据 表示 这 个 进程 占用 的 内 存 大 小 。 在 例子 
中 mail 程序 比 xpaint 占用 少 得 多 的 内 存 。 因 为 后 者 耗费 大 量 的 内 存 来 存储 影像 。 程 序 在 运 
行 的 时 候 占 用 的 内 存 数 量 可 能 会 动态 的 改变 。 如 果 程 序 在 运行 时 分 配 内 存 ,; 那 么 它 占用 的 
内 存 就 会 增加 。 

WCHAN 列 显示 进程 睡眠 的 原因 。 上 面 的 例子 中 所 有 睡眠 的 进程 都 是 等 待 输入 。read 
cH do sel 代表 内 核 的 地 址 。ADDR 和 下 已 经 不 再 用 了 ,但 是 为 了 兼容 的 原因 而 保留 它们 。 
选项 -ly 将 只 显示 目前 使 用 的 值 。 

各 个 版 本 的 Unix 间 的 可 选 命令 参数 差别 很 大。 前 面 提 到 的 -a 和 -! 可 选项 可 能 在 你 
的 系统 中 不 能 用 或 者 结果 不 同 。 查 阅 你 的 用 户 手 册 。 上 面 的 例子 是 来 自 于 版 本 号 为 procps 
2.0.5。 例 子 只 给 出 了 ps 的 一 部 分 显示 功能 。 

ps 命令 是 很 强大 的 。 -fa 可 选项 产生 如 下 和 输出: 


$ ps —fa 
UID PID PPID C STIME TTY TIME CMD 





betsy 
betsy 
betsy 


1779 
1980 
1781 


yuriko 2013 
yuriko 2017 


bruce 


2401 


1731 
1779 
1731 
1893 
1993 
1755 
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cuo CO oo oo 


19:53 pts/0  00;00;01 gv dinner. ps 
19:53 pts/O 00:00:07 gs - dNOPLATFONTS 
19.54 pts/O  00;00:02 vi dinner 

20:15 pts/2 00,00:00 xpaint 

20:16 pts/2 00:00:00 mail bruce 

20:36 pts/1 00 ;00;00 ps — af 


-f 表示 格式 化 输出 ,这 样 便于 阅读 。 用 用 户 名 代替 UID 来 显示 。 在 CMD 列 显示 完整 
的 命令 行 ， 


8. 2. 1 


系统 进程 


除了 用 户 运行 的 进程 外 ,其 他 一 些 是 Unix 系统 用 来 完成 系统 任务 的 进程 : 


$ ps -ax | head - 25 
PID TIY STAT 


1? S 
23 SW 
37 SW 
a? SW 
5? SH 

35? SW 
36 7 SR 

420 ? S 

423 ? S 

437 5 E] 

449 ? S 

461 Y sH 

466 ? S 

471 ? 8 

476 ? S 

484 ? SH 

500 ? S 

504 ? SW 

506 7 SW 

512 ? SW 

514 ? SH 

561 ttyl SW 


562 tty2 SW 
563 tty3 SW 


5 ps -as|wc - 1 


82 


TIME 
0:05 
3:54 
0:38 
0:00 
2:13 
0:00 
0:00 
0:25 
0:36 
0.00 
0:02 
0:00 
0 00 
0:00 
0:00 
0:00 
0:46 
0:00 
0,00 
0-00 
0:00 
0:00 
0:00 
0:00 


COMMAND 

init 

[kflushd | 

[kupdate ! 

[kpiod] 

[kswapd] 
[uhci - control] 
[khubd]] 

syslogd 

klogd ~ k /boot/System.map- 2.2.14 
[ inetdj 

and - f /etc/am, d/cont 
( rpciod] 

cron 

atd 

sendmail: accepting connections on port 25 
[rpc.rstatd] 

sshd 

[ calserver | 
[keyserver] 
[portsentry]| 
Lportsentry] 

[getty] 

[getty] 

(getty 


上 面 的 例子 显示 了 当前 系统 中 运行 的 82 个 进程 中 的 前 24 个 。 其 中 部 分 是 系统 进程 。 
系统 进程 中 的 很 大 一 部 分 是 没有 终端 与 之 相连 的 。 它 们 在 系统 骨 动 时 启动 ,而 不 是 由 用 户 
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在 命令 行 输 人 . 这 些 系统 进程 做 些 什 么 呢 ? 
列表 中 开始 的 几 个 分 别处 于 内 存 的 不 同 部 分 .包括 内 核 缓 冲 和 虚 存 页 面 。 列 点 中 的 其 
他 一 些 管理 系统 口 赤 (klogd,syslogd) . 3] EHAE% (cron, aid) .防范 可 能 的 攻击 (portsentry) 
和 证 一 般 的 用 户 登 录 (sshd,gettv)。 可 以 通过 ps 一 ax 的 输出 和 Unix 手册 了 解 很 多 系统 的 
情况 。 运行 ps 就 像 透 过 显微镜 看 一 消 池 塘 水 。 能 看 到 很 多 各 式 各 样 的 进程 运行 在 系统 中 。 


8.2.2 进程 管理 和 文件 管理 


从 运行 ps 的 结果 看 出 进程 有 很 多 届 忻 ， 每 个 进程 属于 某 个 用 户 [D、 有 一 定 的 大 小 ,一 
个 起 始 时 间 .已 运行 的 时 间 .优先 级 和 niceness 级 别 。 有 些 进 程 与 某 个 终端 相连 ,而 其 他 一 些 
则 没有 。 这 些 属性 存放 在 什么 地 方 呢 ?和 曾 对 文件 提 过 同样 的 问题 。 内 核 管 理 内 存 中 的 进程 
和 做 瘟 上 的 文件 。 这 些 管理 活动 有 什么 相似 之 处 吗 ? 

文件 包含 数据 ,进程 包含 可 执行 代码 。 文 件 有 一 些 属 性 , 进 竹 也 有 一 些 属 性 。 内 核 建立 
和 销毁 文件 ,进程 类 似 。 就 像 管 理 磁 盘 的 多 个 文件 ,内 核 管 理 内 存 中 的 多 个 进程 ,为 它们 分 
配 空间 ,并 记录 内 存 分 配 情况 。 内 存 管理 和 磁盘 管理 有 什么 相似 之 处 ? 


8.2.3 内 存 积 程序 


进程 这 个 概念 有 些 抽象 .但 是 它 代表 了 一 些 非常 实际 的 实体 ; 内 存 中 的 Here 35. B 
8.3 演示 了 计算 机 内 存 的 3 种 模式 。 





内 存 可 以 看 作 是 一 个 容纳 内 该 
HL zt FM 55 18] 

很 多 系 统 把 内 存 看 作 了 岂 页 面 构 
I9, i dc 48 WE E BE} BHA HK Fd] 
(um. 物理 七 ,这 些 页 面 可 
能 被 存放 在 国体 的 芯片 中 。 WE ”进程 4 ”进程 B 


A 





8.3 ELTE 3 种 模式 


Unix 系统 中 的 内 个 分 为 系统 空间 和 用 户 空间 。 进 程 存在 于 用 户 空间 。 内 存 实际 上 就 是 
一 个 字 节 序列 ,或 者 一 个 很 大 的 数组 。 如 果 机 器 有 64 MBNA BRB AKA 
6700 万 个 内 存 位 置 。 其 中 的 一 些 用 来 存放 组 成 内 核 的 机 器 指令 和 数据 ， 

还 有 一 些 存 放 组 成 进程 的 机 器 指令 和 数据 。 一 个 进入 不 一 定 必 须要 占 一 段 连续 的 内 
存 。 就 像 文 件 在 磁盘 上 被 分 成 小 块 ,进程 在 内 存 也 被 分 成 小 去 。 同 样 和 文件 有 记录 分 号 了 
的 磁 副 块 的 列表 相似 ,进程 也 有 保存 分 配 到 的 内 存 页 面 (memory pages) 的 数据 结构 。 因 此 ， 
将 进程 表示 为 用 户 空间 内 的 一 个 小 方块 只 是 某 种 程度 的 抽象 。 

将 内 存 表示 为 连续 的 字 节 数组 也 是 一 种 柚 象 。 现 在 的 内 存 一 般 情况 下 是 由 小 电路 板 上 
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的 一 些 芯 片 组 成 。 

建立 一 个 进程 有 点 像 建立 一 个 磁盘 文件 。 内 核 要 找到 一 些 用 来 存放 程序 指令 和 数据 的 
空 闪 内 存 页 。 内 核 还 要 建立 数据 结构 来 存放 相应 的 内 存 分 配 情况 和 进程 访 性 。 

使 操作 系统 变 得 神奇 的 不 仅 是 它 的 文件 系统 把 一 堆 旋 转 圆 盘 上 连续 的 簇 变 成 有 序 组 
织 的 树 状 目录 结构 ,而 且 以 相似 的 机 制 , 它 的 进程 系统 将 硅 片 上 的 一 些 位 组 织 成 一 个 进程 
社会 一 一 成 长 、 相 互 影响 .合作 出生、 工作 和 和 死亡。 这 有 点 像 蚂 蚁 农庄 。 

为 了 理解 进程 ,下 面 将 学 习 和 实现 一 个 Unix shell, shell 是 一 个 管理 和 运行 程序 的 
程序 。 


8.3 shell: 进程 控制 和 程序 控制 的 一 个 工具 


shell 是 一 个 管理 进程 和 运行 程序 的 程序 。 就 像 存在 很 多 编程 语言 , Unix 系统 有 很 多 种 
可 用 的 shell, 每 种 都 有 各自 的 风格 和 优势 。 所 有 常用 的 shel 都 有 三 个 主要 功能 ， 

OD 运行 程序 

(2) 管理 输入 和 输出 

(3) 可 编程 

看 看 下 面 的 命令 序列 ; 


S grep lp /etc/passwd 
lpix;d:7;lp:/var/spool/lpd; 

5 TZ- PST@PDT; export. TZ;íate;TZ = ESTSEDT 
Sat dul 28 02:10:05 PDT 2001 

S date 

Sat Jul 28 05:10:14 EDT 2001 

$ ls -1 /etc >> ete. listing 


$ NAME- lp 

$ if grep 5 NAME /etc/paaswd 
‘> then 

= echo hello | mail $ NAME 
L—fi 
1p:x;4;7;lp:/var/spool/lpd;: 
$ 


(1) 运行 程序 

grep date, ls echo 和 mail 都 是 一 些 普 通 的 程序 ,用 C 编写 ,并 被 编译 成 机 器 语言 。shell 
将 它们 载 人 内 存 并 运行 它们 。 很 多 人 把 shell 看 成 是 一 个 程序 启动 器 (program launcher). 

《2) 管理 输入 和 输出 

shell 不 仅仅 是 运行 程序 。 使 用 二 、 污 和 | 符 导 可 以 将 输入 .输出 重 定 向 。 这 样 就 可 以 上告 
诉 shell 将 进程 的 输入 和 输出 连接 到 一 个 文件 或 是 其 他 的 进程 。 

(3) 编程 
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shell 同时 也 是 带 有 变量 和 流程 控制 的 编程 语言 。 在 上 面 的 例子 中 ,可 以 看 到 使 用 了 两 
个 变量 。 首 先 , 变 量 TZ 被 设 署 成 表示 美国 西海 岸 时 区 的 字符 诗 ， 然 后 这 个 值 被 作为 参数 传 
给 date 命令 来 打印 当前 的 日 期 和 时 间 。 

例子 的 后 面部 分 ,可 以 看 到 有 il. then Ba, BR NAME RBH SHB "Ip", 
$ NAME 的 值 在 grep 命令 中 被 使 用 。grep 的 结果 由 if 语句 进行 判断 。 如 时 在 文件 /etc/ 
passwd 中 搜索 到 字符 串 “)p” shell 就 执行 命令 echo hello| mail $ NAME。 否 则 跳 至 下 一 条 
命令 。 

EARP , 先 来 看 看 shell 是 如 何 运 行 一 个 程序 的 。 在 后 面 的 章节 中 将 学 习 shell 的 脚本 
语言 和 输入 .输出 的 重 定向 。 


8.4 shell 是 如 何 运行 程序 的 


shell 打印 提示 符 , 输 入 命令 ,shell 就 运行 这 个 命令 ,然后 shell 再 次 打印 提示 符 一 - -如 此 
反复 。 那 么 这 些 现 象 的 背后 到 底 发 生 些 什 么 ? 

一 个 shell 的 主 循环 执行 下 面 的 4 步 (如 图 8. 4 所 示 ): 

COD RIP BEA a. out; 

(2) shell 建立 一 个 新 的 进程 来 运行 这 个 程序 ; 

(3) shell FEES FF JA BERRA « 

(4) 程序 在 它 的 进程 中 运行 直到 结束 。 





yr ut Ee she 


进程 管理 
系统 


程序 





图 3,14 AAR SER shell 运行 一 个 程序 


8.4.1 shell 的 主 循环 
shell 由 下 面 的 循环 组 成 : 


while¢ | end of input) 
get conmand 
execute command 


wait For command to finish 


考虑 下 面 这 个 与 shell 典型 的 互动 : 
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$ ls 

Chap. bak Story08. tr chap08. ps chap08. tr outline. 08 
Makefile chap08 chap08. short code pix 

$ Bs 

PID TTY TIHE CHD 


29182  pts/S 00:00:00 bash 
29183 pts/5  00;00:00 ps 
$ 


用 图 8.5 的 时 间 轴 来 表示 事件 发 生 次 序 ， 其 中 时 间 从 左 向 右 消 遂 。shel 由 标识 为 sh 


的 方块 代表 , 它 随 着 时 间 的 流逝 从 左 到 右 移 动 。shell MARATE”. shell 建立 一 
个 新 的 进程 ,然后 在 那个 进程 中 运行 ls 程序 并 等 待 那个 进程 结束 。 


时 间 
* Bh ee s D w ee ee EMNEM EM NE Pw Ho à » HM E E*EMEEMESASESESM3as-mimmaus».maa > 
读 人 命令 RAGS 
等 待 退 出 等 竺 退出 
El E Eee 
| Be | 新 进程 
hl ie 
Lea] ls poe eee. L| P p—s 2 
EWE FAS 
运行 命令 退出 igri > 退出 
Is "ps" 


图 8.5 shell d: ff ép B] [E] Rh 


然后 shell 读 人 新 的 一 行 输入 ,建立 一 个 新 进程 ,在 这 个 进程 中 运行 程序 并 等 待 这 个 进程 
结束 。 

当 shell 检测 到 输入 结束 , 它 就 退出 。 

为 了 要 写 个 shell, BLESS: 

(D 运行 一 个 程序 ; 

(2) 建立 一 个 进程 ; 

(3) 等 待 exi, 

当 学 会 这 些 , 就 能 用 这 些 技术 来 实现 自己 的 shell T. 


8.4.2 问题 1: 一 个 程序 如 何 运行 另 一 个 程序 


答案 : 程序 调用 execvp, 

图 8.6 SRT SRR Animi - T EF. ELI. Tit ls -la, 一 个 程序 调用 
execvp("Is",arglist), ix B arglist Ef t fg 89 5E HEB TRIBU PEARL RE SEHE ERE LACAN E 
命令 参数 ls 和 -la 被 传 给 程序 ,然后 程序 开始 运行 。 简 而 言 之 : 
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Unix 如 何 运行 - SBA: 





cxeevp . pzogname. árglist) 

EA ITE 

l dedo ut 05 BE EE 9) 8 TH 
它 的 进程 

2. ME AS ae 09] Y Ee (PE OS 
argv[i Hle ik BUR 


3. ie fpi T EY 





8.6 cxecvp 将 程序 复制 人 到 内 存 后 运行 它 


C) FIr execvp 

(2) 内 核 从 磁盘 将 程序 载 人 
(3) 内 核 将 arglist 复制 到 进程 
(4) PERLE] main(arge, argv) 
下 面 是 运行 ls ~! SEMEL. 


/* eXecl.c - shows how easy it is for a program to run a program 


=f 


ma ind) 
i 
char x arolist[3]; 
arglist[0] = "Is"; 
arglist[1] = "~ i"; 
arglist[2] = 0; 
printf(" exx About to exec 1s - l\n")- 
execvp( "ls" , argiist ); P 


printf("*»** ls is done. bye\n"); 


execvp 有 了 两 个 参数 ;要 运行 的 程序 名 和 那个 程序 的 命令 行 参 数 数组 。 当 程序 运行 时 命 
令 行 参 数 以 argv[] 传 给 程序 。 注 意 ,将 数组 的 第 一 个 元 素 置 为 程序 的 名 称 ， 还 要 注意 .最 后 
一 个 元 将 必须 是 null, 

编译 并 运行 这 个 程序 ， 

$ cc execl.C - o axrecl 


$ ./execl.c 


4«43 About to exec ls - 1 
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total 28 

drwxr-x--- 2 bruce users 1024 Jul 14 21-02 a 
drwxr-x-—— 3 bruce users 1024 Jul 16 03:16 c 
-rw-r--r-- 1 bruce users O Jul 14 21:03 y 
$ 


]， 第 二 条 打印 的 消息 哪里 去 了 ? 

再 看 一 下 代码 。 程 序 宣布 它 要 运行 is 程序 ,运行 js 程序 ,然后 宜 布 ls 运行 结束 。 那 么 
第 二 条 信息 昵 ? 

一 个 程序 在 一 个 进程 中 运行 一 - 也 就 是 一 些 内 存 和 内 核 中 相应 的 数据 结构 这样 ， 
execvp 将 程序 从 磁 是 载 人 进程 以 便 它 可 以 被 运行 。 但 是 载 人 到 哪个 进程 呢 ? 这 就 是 问题 立 
所 在 : 内 核 将 新 程序 载 人 到 当前 进程 ,替代 当前 进程 的 代码 和 数据 。 

2. cxecvp 就 像 换 脑 

有 人 可 能 会 有 这 样 的 属 户 :“ 我 希望 能 用 爱 册 斯坦 的 脑子 解决 这 个 问题 ,然后 再 用 自己 
的 脑子 做 其 他 的 事情 ," 一 种 实现 这 个 愿望 的 方法 是 拿 掉 你 的 大 脑 ,然后 装 上 爱 因 斯 坦 的 大 
脑 。 这 样 你 就 拥有 了 了 爱 因 斯 坦 的 思想 和 分 析 能 力 。 这 样 想 拥 有 两 个 思维 的 感 望 就 和 原来 的 
大 脑 了 -… 起 被 拿 掉 了 。 

cxec 系统 调用 从 当前 进程 中 把 当前 程序 的 机 器 指令 清除 ,然后 在 空 的 进程 中 载 人 调用 
时 指定 的 穆 序 代码 ,最 后 运行 这 个 新 的 程序 。exec 调整 进程 的 内 存 分 配 使 之 适应 新 的 程序 
对 内 存 的 要 求 。 相 网 的 进程 ,不 同 的 内 容 。 

execvp() fa Zn F. 
































execvp 
目标 O OOOO 在 指定 路 径 中 查找 并 执行 -- 个 文件 "nd 
AM # include <Cunistd, h 
BR ER RI result = exeevp(const char * file, const char * argv[ 1) 
7 参数 file 要 执行 的 文件 名 
argv 字符 串 数 组 
is i fi =l 如 果 出 错 


execvp Ah file 指定 的 程序 到 当前 进程 ,然后 试图 运行 它 。execvb 将 以 NULL 结尾 
的 字符 串 列表 传 给 程序 。execvp 在 环境 变量 PATH 所 指定 的 路 径 中 查找 file 文件 。 

SU AAT RO .exeevp 没有 返回 值 。 当 前 程序 从 进程 中 清 路 ,新 的 程序 在 当前 进程 中 
运行 。 

3. b RR RAP) shell 

前 面 所 学 已 经 足够 写 第 一 个 版 不 的 shell 了 。 这 里 已 经 知道 如 何 运行 一 个 程序 ,还 知道 
如 何 将 命令 行 参 数 传 给 它 。 第 一 个 shell 提示 用 户 输入 程序 名 和 参数 ,然后 运行 指定 的 程序 。 





全 和 所 有 席 有 大 蚁 记忆 中 要 做 的 事情 ， 
Q cxeevp 是 … 组 基于 execve RHA MRE CH E PARRY exec, 
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将 程序 命名 为 pshl. c, 它 是 带 提示 符 的 shell(prompting shell) 的 缩写 ， 


/* prompting shell version 1 

* Prompts for the command and its arguments. 

* Builds the argument vector for the call to execvp. 
* Uses execvp(), and never returns. 


xf 


# include <istdio. hr 
# include «signal, h> 
# include «string. h> 


# define MAXARGS 20 /* cmdline args» / 

# define ARGLEN 100 /* token length: / 

int main(} 

{ 
char * arglist[MAXARGS + 1]; /* an array of ptrsx/ 
int numargs; /* index into array*/ 
char argbuf[ ARGLEN] ; /* read stuff herex/ 
char * nakestring(); /* malloc etc «/ 


numargs = 0; 
while ( numargs <, MAXARGS ) 
1 
printf("Arg| *& d]? ", numargs); 
if ( fgets(argbuf, ARGLEN, stdin) && * argbuf 1= 'VXn') 


arglist[numargs ++ | = makestring(argbuf); 


eise 
{ 
if ( numargs > 0 ){ /* any args? «/ 
arglist[numargs ! = NULL; /* close list »/ 
execute( arglist ); /* do it «/ 
numargs = 0; /* and reset «/ 
} 
} 
} 
return 0; 


} 


int execute( char s arglist| 1 ) 
/* 
* use execvp to do it 
x/ 
{ 
execvp(arglist(0_, arglist); fe do it «/ 


perror("execvp failed"); 
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exit(1); 


1 
H 
i 


char + makestring( char * buf ) 

ie ` 
* trim off newline and create storage for the string 
4; 

{ 


char * cp, * malloc(); 


buffstrlen(buf)—- 1] = 'X0'; /* trim newline x/ 
cp = malloc( strlen(buf) + 1); /* get memory x/ 
if (cp == NULL | ; /* or die «/ 
fprintf(stderr, no memory\n") ; 
exit(1); 
} 
strcpy(cp, buf); /* copy chars x/ 
return cp; /* return ptr «/ 


à 

psht. c Æ Unix shell 的 第 一 个 草案 。pshl 要 求 每 个 字符 申 单 独 的 输入 ,第 一 个 是 程序 
名 ,然后 依次 是 程序 参数 。 代 码 包 括 两 步 : CO 一 个 字符 中 一 个 字符 串 的 构造 参数 列表 
arglist, 最 后 在 数组 末尾 加 上 NULL; (2) 将 arglistL0] 和 arglist 数组 传 给 execvp. MA 8.7 
所 示 。 








1. 将 命令 行 读 和 缓冲 。 
2 将 缓冲 分 割 为 参数 列表 。 
3 45 S SERIE ES cxccvp。 


图 8.7 用 数组 构造 afglist 


编 泽 并 运行 程序 : 


$ cc pshl.c - o pshi 
$ ./pshl 
Arg[ 0]? ls 


Arg[17'? -1 
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Arg[ 2]? demodir 


Arg[ 3]? 
total 2 
drwxr-x--- 2 bruce users 1024 Jul 14 21:02a 
drwxr-x—-- 3 bruce users 1024 Jul 16 03:16 c 
-r«-r--r-- 1 bruce users 0 Jul 14 21:03 y 


$ 


4. BEAR HT? 

程序 运行 止 常 ,但 是 就 像 设 起 的 那样 ,execvp mo THEE RT shell 的 程 
序 代码 ,然后 在 命令 指定 的 程序 结束 之 后 退出 。 这 样 shell 就 不 能 再 次 接受 新 的 命令 。 为 了 
运行 新 的 命令 ,用 户 不 得 不 再 次 运行 shel)。 

shell 如 何 能 做 到 在 运行 程序 的 同时 还 能 等 竺 下 一 个 命令 呢 ? 方 法 之 一 就 是 启动 一 个 新 
的 进程 ,由 这 个 进程 来 执行 命令 程序 ， 


8.4.3 ”问题 2; 如 何 建立 新 的 进程 


答案 ; 一 个 进程 调用 fork 来 复制 自己 ， 

用 法 ; forkO; /*1akes no argumenis#/ 

1. HR fork 

继续 用 爱 因 斯 坦 大 脑 恩 考 的 问题 做 比喻 。 就 像 先 前 看 到 的 ,将 爱 因 斯 坦 的 大 脑 放 到 你 
的 脑壳 里 处 但 把 爱 因 斯 坦 的 思想 给 了 你 ,同时 也 清除 了 所 有 你 原来 大 脑 里 的 思想 ， 

解决 的 方法 之 一 就 是 复制 一 个 自己 ,采用 三 位 影像 复制 技术 ,逐个 原子 的 复制 一 个 完全 
等 价 的 自己 。 当 你 建立 了 自己 的 复制 品 ;将 爱 因 斯 坦 的 大 脑 放 到 它 的 脑壳 里 ,这 样 你 就 可 以 
继续 你 原来 的 计划 和 思考 了 .在 你 生命 中 的 某 个 阶段 ,世界 上 只 有 一 个 你 。 当 你 按 下 复制 


机 的 复制 按钮 ,世界 上 有 了 两 个 你 。 对 自己 的 复制 有 点 像 马 路 上 的 贫 口 。 开 始 只 有 一 条 路 ， 
然后 有 了 两 条 。 





fork 之 前 fork 之 后 
父 进程 THE 








新 的 进程 拥有 和 父 进程 相同 的 
代码 和 数据 


BJ8.8  {ork() 复 制 一 个 进程 
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这 就 是 系统 调用 fork xag Ef. P 8. 8 显示 了 fork 调用 前 后 的 系统 状况 。 进 程 拥 有 程 
序 和 当前 运行 到 的 位 置 。 进 程 调用 fork, 当 控制 转移 到 内 核 中 的 fork 和 代码 后 ,内核 做 : 

(OD 分 配 新 的 内 存 块 和 内 核 数据 结构 

(2) 复制 原来 的 进程 到 新 的 进程 

(3) 向 运行 进程 集 添 加 新 的 进程 

(4) 将 控制 返回 给 两 个 进程 

当 你 按 下 复制 机 的 开始 按钮 后 ,世界 上 将 有 两 个 你 ,物理 上 、 心 理 上 都 是 相 闻 的 。 但 是 
每 个 人 将 开始 你 (他 ) 自 己 的 人 生 之 路 。 类 似 地 , 当 一 个 进程 调用 fork 之 后 ,就 有 两 个 二 进 制 
代码 相同 的 进程 。 而 且 它 们 都 运行 到 相同 的 地 方 。 但 是 每 个 进程 都 将 可 以 开始 它们 自己 的 
旅程 。 看 如 下 程序 

2. 例子 ; forkdemol.c 建立 一 个 新 的 进程 

forkdemol. c 4 BS AFT Ep iE A, — WHE fork 之 前 ,一 句 在 fork 之 后 ， 





/* forkdemot.c 
* shows how fork creates two processes, distinguishable 


* by the different return values from fork() 
x/ 
# include <(stdio. h> 


maint ) 
{ 
int ret_from_fork, mypid; 
/* who am i? x/ 


mypid = getpid(); 
/* tell the world x/ 


printf("Before: my pid is & dn", mypid); 
ret from fork = fork(); 
sleep(1); 
printf ("After:; my pid is %d, fork() said * din", 
| getpid(), ret from fork); 
i 
如 果 这 是 一 个 普通 的 程序 ,将 看 到 两 行 输出 ,每 行 打印 一 个 状态 。 但 是 当 它 运行 时 将 
看 到 : 


$ cc forkdenol.c - o forkdenol 

$ ./forkdemol 

Before;my pid is 4170 

After:my pid is 4170 fork() said 4171 
$ After, my pid is 4171,fork() said 0 


”这 里 可 以 看 到 三 行 输出 ,一 行 Before: 信息 和 两 行 After: 信息 。 进程 4170 先是 打印 
Before: 消息 ,然后 它 又 打印 After: 消息 一 一 一 切 正常 。 另 一 个 After: 信息 是 由 进程 4171 
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打印 的 。 注 意 进程 4171 没有 打印 Before; FAR. 为 什么 呢 ? 用 户 空间 的 近 黑 (如 图 8. 9 所 
示 ) 显 示 了 进程 4170 调用 fork 前 后 发 生 了 什么 。 


fork 之 前 fork 之 后 











AOE EP TSF eas SITES ESTE 270 + 
a 


fir 





一 个 控制 流 进 入内 核 的 fork 模块 调用 完成 时 ， 从 fork 返回 两 个 控制 流 
图 8,9 FERRI fork OS RAE 


内 核 通 过 复制 进程 4170 来 创建 进程 4171, 它 将 4170 的 代码 和 当前 运行 到 的 位 置 都 复 
制 给 4171。 其 中 当前 运行 的 位 置 是 由 随 着 代 公 向 下 移动 的 箭头 表示 的 。 新 的 进程 4171 从 
fork 返回 的 地 方 开 始 运 行 , 而 不 是 从 开头 开始 运行 。 因 为 4171 是 从 中 间 开 始 运行 的 ,也 就 不 
打印 Before: 信息 了 。 

3. 81-f : forkdemo2. ce 一 一 子 进程 创建 诗 程 

子 进程 不 是 从 main 序数 的 开始 ,而 是 从 fork 返回 的 地 方 开始 它 的 生命 之 旅 ， 预 测 一 下 
下 面 程序 会 有 几 行 输出 : 


/* Forkdemo2.c - shows how child processes pick up at the return 


* from fork() and can execute any code they like, 
* even fork(). Predict number of lines of output. 
*/ 

main() 


( 
printf("my pid is $ d\n", getpid() ); 
Fork(); 
fork(); 
fork(); 
printf("my pid is & d\n", gerpid() 5; 
} 


编译 并 运行 这 个 程序 ,结果 如 何 ? 

4, 例子 ; forkdemo3,c SPB AL to FF UE 

从 forkdemol. c 可 以 看 到 进程 4170 调用 fork 创立 子 进程 , 子 进 程 PID 是 4171 。 两 个 进 
程 有 相同 的 代码 ,运行 到 同一 行 有 相同 的 数据 和 进程 属性 。 那么 如 何 才 能 分 辩 到 底 是 父 进 
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程 还 是 子 进程 呢 ? 

这 两 个 进程 不 是 完全 相同 的 。 礁 forkdemol. c 的 输出 可 以 看 出 ,不 同 的 进程 ,fork 的 返 
回 值 是 不 同 的 。 在 子 进程 中 fork 返回 0, 在 父 进 程 中 fork 返回 4171, de fork 的 返回 值 进 
程 可 以 很 容易 的 判断 自己 是 子 进程 还 是 父 进程 。 

在 下 一 个 例子 forkdemo3. c 中 ,进程 根据 fork 返回 值 的 不 同 打印 不 同 的 消息 ， 


/* forkdemo3.c - shows how the return value from fork() 


x allows a process to determine whether 
x it is a child or process 
x/ 


# include < stdio. h> 


main) 
{ 


int fork_rv; 
printf("Before; my pid is %d\ne, getpidt}}; 
fork rv - fork(); /* create new process */ 


if ¢ fork rv == =-1) /* check for error «/ 


perror("fork'); | 


else if ( fork rv == 0) 
printf("I am the child. my pid = $ din", getpid()}; 
else 
printf("I am the parent. my child is $ d\n", fork rv); 
} 


下 面 是 运行 结果 : 


$ ./forkdemo3 ` 
Before: my pid is 5931 

Iam the parent. my child is 5932 

Iam the child. my pid = 5932 

$ 


fork 小 结 如 下 。 

系统 调用 fork 正 是 解决 shell 只 能 运行 -条 命令 这 个 问题 所 需要 的 。 和 使 用 fork ,不 但 能 
够 创建 新 的 进程 ,而 且 能 够 分 辨 原来 的 进程 和 新 创建 的 进程 。 新 的 进程 能 调用 execvp 来 执 
行 任何 用户 指明 的 程序 。 

这 里 明确 建立 一 个 shell 所 需 一 项 技术 中 的 两 项 。 知 道 了 如 何 建立 进程 (fork) 和 如 何 运 
行 一 个 程序 (execvp)。 最 后 需要 知道 如 何 让 父 进程 等 待 子 进程 结束 ， 





























fork 
z 目标 创建 进程 

头 文件 # include«Zunistd, h> 
函数 原型 | pid t result = fork( void) = 
pt 没有 
返回 值 =I MABE 

0 返回 到 子 进程 

pid 将 子 进程 的 进程 iD 传 给 父 进程 


8.4.4 问题 3: 父 进程 如 何等 待 子 进程 的 退出 


SE. 进程 调用 wait 等 待 子 进程 结束 。 

用 法 : pid = wait(Gcstatus) ; 

1. AEF wait 

系统 调用 weit AMOR PESE. SA wat 暂停 调用 它 的 进程 直到 子 进程 结束 。 然 后 ,wait 取 
得 子 进程 结束 时 传 给 exit 的 值 。 

图 8. 10 显示 了 wait 是 如 何 工 作 的 。 注 意 时 疗 轴 是 自 左 向 右 的 , 父 进 程 在 左边 开始 调用 
fork。 内 核 构 造 子 进程 ,这 里 子 进 程 由 另外 一 个 小 方块 代表 。 子 进程 开始 和 父 进 程 并 行 运 
行 , 父 进程 调用 wait 内 核 挂 起 父 进 程 直 到 子 进程 结束 。 父 进程 标识 为 wait 的 一 段 暂 停 


运行 。 
fork () wait ( ) 
| }--=-7-{ | 一 一 一 一 一 eae S 


图 8.10 wait 暂停 父 进 程 直 到 子 进程 结束 


最 终 子 进程 会 结束 任务 并 调用 exit(n), n 是 0 到 255 的 一 个 数字 。 

当 子 进程 调用 exit ,内 核 唤醒 父 进程 同时 将 子 进程 传 给 exit 的 参数 。 唤 醒 和 传递 退出 
(exit)? 值 的 动作 由 从 exit 的 括号 到 父 进程 的 稍 头 表示 。 这 样 wait 执行 两 个 操作 : 通知 和 
通信 。 

2. 例子 : waitdemol.c 通知 

waitdemol. c 显示 了 子 进程 调用 cxit Hii f Ae wait 返回 父 进程 的 。 





/* waitdemol.c — shows how parent pauses until child finishes 


xj 
H include < stdio. h> 


# define DELAY 2 
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main() 
1 
int newpid; 
void child code(), parent code(); 


printf("before; mypid is * d\n", getpid()); 


if ( (newpid = fork()) == -1) 
perror( fork"); 
eise if ( newpid == 0) 
child code(DELAY): 
eise 
parent code(newpid); 
} 
/* 
* new process takes a nap and then exits 
xf 
void child_codet int delay) 
{ 
printf("child % d here. will sleep for %d seconds\n", getpid(), delay); 
sleep( delay) ; 
printf( "child done. about to exit\n"); 
exit(17):; 
} 
{x 
* parent waits for child then prints a message 
«f 
void parent code(int childpid) 
4 
int wait rv; /* return value from walt() */ 
wait rv = wait(NULD)D; 
printf("done waiting for &d. Wait returned; * din", childpid, wait rv); 


运行 waitdemol, c 的 结果 如 下 : 


S . /waitdemol 

before; mypid is 10328 

child 10329 here. will sleep for 2 seconds 
child done. about to exit 

do waiting for 10329. Wait returned;10329 


运行 程序 ,调整 时 间 , 可 以 发 现 父 进程 总 会 等 到 子 进程 调用 exit, PH 8. 11 演示 了 控制 流 
和 两 个 进程 之 间 的 数据 传输 。 在 父 进 程 ,控制 流 始 于 程序 的 开始 ,在 wait 的 地 方 阻塞 。 在 子 
进程 ,控制 流 始 于 main 函数 的 中 部 ,然后 运行 child_code 函数 ,最 后 调用 exit 结束 。 子 进程 
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调用 exit 就 像 发 送 一 个 信号 给 父 进程 以 唤醒 它 。 


| parent child 






| eina coat) 
( 

MS 

Y exitin) : 
| 





“0 BR YE «was 2b Gi we. 
然后 在 子 进 程 巡 出 后 继 
Set. 


[ 





exitíni: 


| TE uae 





barent_codal) 







{ 


l int status; int status; 





Y walti&staths!; 
1 


Tl 


PA 8.11. 调用 waii() 前 后 的 控制 流 和 进程 向 通信 


wait(&status]; 














waitdemol.c 程 序 体 现 了 wait 的 两 个 重要 特征 : 

C1) wait 阻塞 调用 它 的 程序 直到 子 进程 结束 

在 这 个 简单 的 程序 中 , 父 进 程 阻 赛 直 到 子 进 程 调用 exit， 这 一 特征 使 两 个 进程 能 够 同步 
它们 的 行为 。 比 如 , 父 进程 用 fork 创建 一 个 子 进程 米 对 一 个 文件 排序 。 父 进程 必须 等 排序 
结束 后 才能 继续 处 理 这 个 文件 。 系 统 调用 exit 和 wat 是 一 -种 协调 这 些 任务 的 方法 。 

(2) wait 返回 结束 进程 的 PID 

在 这 个 简单 的 程序 中 ,wait 的 返回 值 是 调用 exit 的 子 进程 的 PID。 就 像 存 forkdemo2. c 
中 看 到 的 ,一 个 进 各 可 以 创建 多 个 子 进程 。 考 虑 一 个 从 两 个 不 同 的 远程 数据 库 整 合 数据 的 
程序 。 这 个 程序 可 以 使 用 fork 来 创建 两 个 进程 ,一 个 用 来 连接 并 从 数据 库 中 提取 数据 . 另 一 
个 从 其 他 数据 库 提 取 数 据 ， 从 第 “个 数据 库 提 取 来 的 数据 和 需要 做 些 后 期 处 理 ,而 从 第 二 个 
数据 库 提 取 玉 的 数据 则 不 澳 蓉 这样 的 处 理 。 

wait 的 返回 值 告诉 父 进程 那 个 任务 结束 了 。 这 样 它 就 可 以 继续 有 效 的 处 理 了 。 

3. 例子: waitdemo2. c 一 一 通信 

wait 的 目的 之 一 第 遂 知 父 进 和 虱子 进程 结束 运行 了 。 它 的 第 二 个 目的 是 告诉 父 进程 子 进 
程 是 如 人 和 何 结束 的 。 

一 个 进程 以 3 种 方式 (成 功 、 失败 或 死亡 ) 之 一 结束 。 其 一 ,一 个 进程 可 能 顺利 完成 它 的 
任务 。 按照 Unix 炽 例 ,成 功 的 程序 调用 exit(0) 或 者 从 main 函数 中 return 0. 

其 二 ,进程 可 能 和 失败。 比如 进程 可 能 由 于 内 存 耗 尽 而 提前 垦 出 程序 : 按 Unix RAE 
序 通 到 问题 而 要 退出 调用 'exit 时 传 给 它 一 个 非 零 的 值 。 程序 员 可 以 对 不 同 的 错误 分 配 不 同 
的 值 , 手 册 中 有 详细 的 描述 。 
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最 后 ,程序 可 能 被 一 个 信和 号 杀 死 ( 见 第 6 和 第 7 3€. SOK ELE c MMS A 
核 或 者 其 他 进程 。 通常 的 情况 下 .一 个 既 没 有 被 忽略 又 没有 被 捧 获 信号 会 杀 死 进程 的 . 

wait 返回 结束 的 子 进 程 的 PID 给 父 进程 。 父 进程 如 何 知道 子 进程 是 以 何 种 方式 退出 
的 呢 ? 

答案 在 传 给 wait 的 参数 之 中 。 父 进程 调用 weit 时 传 一 个 整 测 变量 地 址 给 三 数 。 内 核 
将 子 进 程 的 退出 状态 保存 在 这 个 变量 中 。 如 果子 进程 调用 exit 退出 ,那么 内 核 把 exit 的 返 
回 值 存放 到 这 个 整数 变量 中 ; 如 果 进 程 是 被 杀 死 的 ,那么 内 核 将 信号 序号 存放 在 这 个 变量 
中 。 这 个 整数 由 3 部 分 组 成 一 一 8 个 bic 是 记录 退出 值 ,7 个 bit 是 记 薄 信和 号 序号 , 另 一 个 bit 
用 来 指明 发 生 错 误 并 产生 了 内 核 上 映像 (corc dump), Ø 8. 12 演示 了 了 于 进程 状态 信 的 3 个 
部 分 ， 





exit value = signal number 








parent 


child 





PA 8. 12 FERRARA 3 部 分 


例子 waitdemo2. c 是 基于 waicdemol,c 的 , 它 显 示 了 子 进程 的 退出 状态 ， 


/* waitdemo2.c — shows how parent gets child status 


x/ 
# include < stdio. h> 
# define DELAYS 


maip() 
{ 
int newpid; 


void child code(), parent codeO; 
printf("before: mypid is * din", getoid()); 


if ( (newpid = fork()) == -1) 
perror("fork"5; 

else if ( newpid == 0) 
child code(DELAY); 


else 
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parent_code{newpid) ; 
} 
fs 
* new process takes a nap and then exits 
x/ 
void child code(int delay) 
{ 
printf( "child %d here. wil] sleep for $d seconds\n", getpid(), delay); 
sleep(delay); 
printf("child done. about to exit\n"); 
exit(17); 
} 
FE} 
* parent waite for child then prints a message 
x/ 
void parent code(int childpid) 
1 
int wait rv; /* return value from wait() x/ 
int child status; 
int high 8, low 7, bit 7; 


wait tv = wait(&child status); 


printf("done waiting for &d, Wait returned: d\n", childpid, wait rv); 


high 8 = child status “> 8; /* A111 1111 0000 0000 x/ 
low 7 = child status & Ox7F; /* 0000 0000 0111 1111 x/ 
bit 7.7 child status & 0x80; /* 0000 0000 1000 0000 «/ 


printf("status; exit = *d, sig= $d, core= * dn", high 8, Jos 7, bit 7); 


首先 ,证 waitdemo2 正常 退出 。 退 出 状态 从 子 进程 处 复制 ， 


S ./waitdemo2 

before. mypid is 10855 

child 10856 here. will sleep for 5 seconds 
child done. about to exit 

done waiting for 10856 . Wait returned: 10856 


status: exit=17, sig- 0, core=0 


然后 ,在 后 台 运 行 waitdemo2 ,使 用 kill( 见 第 7 DEMS HE RIK SIGTERM 信和 号， 


5 ./waitdeme2 & 

.$ before: mypid is 10857 

child 10858 here, will sleep for 5 seconds 
kill 10858 
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$ done waiting for 10858, Wait returned; 10858 


status; exit - 0, sig- 15, core- 0 .- 


























waitO PET. 
wait 
目标 等 待 进程 结束 
头 文件 # include «sys/types, h> 
# include <sys/wait. h> 
函数 原型 pid, t result = wait(int * statusptr) 
参数 statusptr 子 进程 的 运行 结果 
返回 值 一 1 MAR 
pid RT RAB id 
相关 内 容 waitpid(2)，wait3t2 —— 


wat 系统 函数 挂 起 调用 它 的 进程 直列 得 到 这 个 进程 的 子 进程 的 一 个 结束 状态 。 结 束 状 
态 是 退出 值 或 者 是 信和 号 序号 。 如 果 有 一 个 子 进程 已 经 退出 或 被 杀 死 ,对 wait 8098 for BA 
E, wait 返回 结束 进程 的 PID. SUR statusptr AE NULL, wait 将 退出 状态 或 者 信号 这 号 
复制 到 statusptr 指向 的 整数 中 。 这 个 值 可 以 用 一 sysywait. h>> 中 的 宏 来 检测 ， 

如 果 调 用 的 进程 没有 子 进 程 也 没有 得 到 终止 状态 值 , 则 wait 返回 一 1。 


8.4.5 小 结 ; shell 如 何 运行 程序 


这 一 节 以 间 题 “shell 是 如 何 运行 程序 的 ?开始 ,现在 已 经 知道 答案 了 :， shell 用 fork Æ 
立新 进程 ,用 exec 在 新 进程 中 运行 用 户 指 定 的 程序 ,最 后 shell 用 wait 等 待 新 进程 结束 。 
wait 系统 调用 同时 从 内 核 取 得 退出 状态 或 者 局 号 序号 以 告知 子 进 程 是 如 何 结束 的 。 l 

每 个 Unix shell 都 是 使 用 图 8.13 上 所 示 的 模型 。 现 在 将 这 3 个 系统 调用 组 合 在 一 起 实现 
一 个 真正 的 shell。 














4. 运行 新 ”5. 新 程序 6 新 程序 结束 
程序 在 运行 


f8 8.13 shell 的 fork exec 和 waitt) 98 9f 
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8.5 实现 一 个 shell: psh2.c 


图 8. 14 是 一 个 Unix shell 的 简化 流程 图 。 下 一 个 shell psh2. c 将 使 用 这 个 流程 。 


—»- get command 


Eus 
| | 
i 

| r— fork —~ 7 
| vid ra 

| l 
|j | 
| E, exit 


图 8.14 Unix shell i5 SE iE 48 


/** prompting shell version 2 
KE 
** Solves the 'one- shot! problem of version 1 "E ie 
x Uses execvp(), but fork()s first so that the 
+% shell waits around to perform another command 
x * New problem; shell catches signals. Run vi, press ^C. 


xe! 


# include <Cstdio. h> 
# include «signal. h> 


# define MAKARGS 20 /* cmdline args */ 
Hdefine ARGLEN 100 /* token length x/ 
main() 
{ 
char + arglist| MAXARGS + 1]; /* an array of ptrs x/ 
int numargs; /* index into array */ 
char argbuf[ ARGLEN]; /* read stuff here «/ 
char  * makestring() : /* malloc etc «/ 


numarqs = 0; 
while ( numargs <_ MAXARGS ) 
{ 
printfC"Arg| & d]? ", numargs); 
if ( fgets(argbuf, ARGLEN, stdin) && x# argbuf l= '\n' ) 
arglist[numargs ++ ] = makestring(argbuf) > 
else 


{ 


if ( numarqs > 03 /* any args? »/ 
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} 


arglist[numargs] = NULL; /# close list */ 
execute( arglist ); /* do it«/ 


numargs = Q; /* and reset «/ 


} 


return 0; 


execute( char x arglist[ 1} 


fx 


+ use fork and execvp and wait to do it 


{ 


} 


int pid,exitstatus; /* of child «/ 


pid = fork(); /* make new process */ 
switch( pid ){ 
case —1: 
perror("fork failed"); 
exit(1); 
case QO; 
execyp(arglist{0], arglist); /* do it «/ 
perror( "execvp failed"); 
exit(1)> 
default: 
while( wait(&exitstatus) |= pid) 
printf ("child exited with status % d, & d\n", 
eritstatus >>8, exitstatus&0377) ; 


char x makestring( char « buf } 


fx 


* trim off newline and create storage for the string 


{ 


char *cp, «malloc(); 


buf[strlen(buf) - 1|] = '\0'; /x trim newline «/ 
cp = malloc( strlen(buf) +1); /* get memory «/ 
if (cp == NULL) /* or die x/ 


fprintf(stderr, "no memory\n") ; 
exit(1); 
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strcpy(cp, buf); /* copy chars x/ 


return cp; /* return ptr «/ 


测试 一 下 psh2 ,看 看 它 是 否 解决 了 只 能 运行 一 条 命令 这 个 问题 : 


$ ./psh2 

Árg[0]? la 

Arg[1]? -1 

Arg[2]? deamodir 

Arg( 31? 

total 2 

drwxr—x--— 2 bruce users 1024 Jul 14 21;02 a 
drwxr- x--- 3 bruce users 1024 Jul 16 03:16 c 
-rw-r--r-- i bruce users 0 Jul 14 21:03 y 
child exited with status 0,0 

Arg 0]? ps 

arg [1]? 

PID TTY TIME CMD 

11616 pts/4 60:00 -00 bash 
. 11548 pts/4 00-00-00 psh2 

11664 pts/4 00:00-00 ps 

child exited with status 0,0 

Arg[0]? pshl HE! 能 运行 pshl T 


Arg[1]? 

Arg[0]? ps RÆ psh 的 握 示 符 ! 
Arg 11? 

PID TTY TIME CMD 
11616 pts/4 00:00:00 bash 
11648 pts/4 00:00:00 psh2 
11683 pts/4 00:00;00 ps 


child exited with status 0,0 
Arg|0]? grep 

Arg| 1]? fred 

Arg[ 2]? /etc/passwd 

hrg[ 3 j? 

child exited with status 1,0 
Arg[0]? fE^D 

Arg[0]? Arg[ 0]? Àrg[ 0]? exit 
Arg[ 1)? 

execvp failed: No such file or directory 
child exited with status 1,0 
Arg[0]? c 

$ 
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hn far A80? 

Psh2.c 工 作 正常 。 新 的 shell 接受 程序 名 称 、 人 参数 列表 .运行 程序 .报告 结果 ,然后 再 重 
新 接受 和 运行 其 他 程序 。Psh2.e 缺少 常用 的 shell 的 一 些 修 第 性 功能 ,但 可 以 作为 一 个 坚实 
的 基础 开始 了 。 

下 一 个 版 本 中 将 做 如 下 改进 : 

CD 让 用 户 可 以 通过 按 下 Cul -Dx EM A"exi B HOUR; 

(2) 让 用 户 能 够 在 一 行 中 输入 所 有 参数 。 

在 下 一 章 实 现 的 版 本 中 加 上 这 些 功能 。 在 郑 个 版 本 中 ,将 加 上 一 些 变量 和 榨 制 流程 使 
它 更 像 一 个 编程 语言 。 

这 之 前 必须 更 正 一 个 严重 的 错误 。 


信号 和 psh2.c 


从 测试 中 可 以 看 到 ,退出 程序 psh? 的 惟一 方法 是 接 Ctrl-C 键 。 如 果 在 psh2 等 待 子 进 
程 结 束 时 键入 Ctrl-C 键 会 如 何 呢 ? 比如 : 


S ./psh2 

Arg[ 0]? te 
Argq(1]? [a-z] 
Arg[ 2]? [A- z] 
Arg[ 3]? 

hello 

HELLO 

now to preas 
NOW TO PRESS 
etrl -C 按 下 ^C 
5 


C ERRARE BE shell BART. HE Ctrl-C 所 生成 的 SIGINT 信和 号 不 但 杀 死 了 运 
f; tr 的 进程 .而 且 杀 死 了 运行 psh2 的 进程 。 为 什么 呢 ? 

键盘 信号 发 给 所 有 连接 的 进程 

程序 psh2 和 tr 都 连接 到 终端 (如 图 8. 15 所 示 )。 当 按 下 中 断 键 ,ttr 驱动 告诉 内 核 向 所 











图 8.15 Sét( 9 RM PUR EE ee 
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有 由 这 个 终端 控制 的 进程 发 送 SIGINT EB, te 死 了 .在 我 们 的 程序 里 , psh 也 死 掉 了 ,即使 
它 还 在 等 待 子 进程 的 结束 ， 
如 何 才 能 让 shell 不 被 用 户 接 下 的 中 断 或 退出 键 杀 死 ?这 个 改动 贸 作 习题 。 


8. 6 思考 : 用 进程 编程 


为 了 理解 Unix 进程 ,运行 了 ps 命令 ,还 学 习 了 sbell 如 何 使 用 fork exit 和 wait 来 控制 
进程 和 运行 程序 。 

在 继续 学 习 下 一 章 有 关 在 shell 中 增加 变量 和 循环 之 前 ,考虑 一 下 函数 和 进程 之 间 的 相 
似 性 。 

1, exeevp/exit 就 从 call/return 

(1) call/return 

一 个 C 程序 由 很 多 函数 组 成 。 一 个 肾 数 可 以 调用 男 一 个 函数 ,同时 传 给 它 一 些 人 参数. 
被 调用 的 函数 执行 一 定 的 祝 作 ,然后 返回 一 个 值 。 和 钴 个 函数 都 有 它 的 局 部 变 晤 ,不同 的 卫 笋 
通过 call/return 系统 进行 通信 l 

APAS AA CUR E B2 eR CT] o8 (i D) E RBA (RE TE 4E 
Wü. Unix 鼓励 将 这 种 应 用 于 程序 之 内 的 模式 扩展 到 程序 之 同 。 这 种 懂 式 可 以 用 图 8. 16 来 
表示 。 








B] 8.16 函数 调用 和 程序 再 用 


(2) exec/exit 

一 个 C 程序 可 以 fork/exec 另 一 个 程序 ,并 传 给 它 一 些 参 数 。 这 个 被 调用 的 程序 执行 一 
定 的 操作 ,然后 通过 exitGnOSEGR PI (E. VELFE] ES (A ERR RT ED SE waited & result) EAR exit 的 
返回 值 。 子 程序 的 exit 返回 值 可 以 在 result 的 8—15 位 之 间 找 到 ， 

函数 调用 所 用 到 的 堆栈 几乎 是 没有 限制 的 。 一 个 被 调用 的 程序 还 可 以 调用 其 他 程序 ， 
一 个 通过 fork/exec 洞 用 起 来 的 程序 可 以 通过 fork/exec 调用 别 的 程序 ，Unix 使 创建 一 个 
mot A EM BR. FA fork/exit 和 exit/wair 来 调用 程序 和 返 同 结果 不 仅 适 用 于 shell. 
Unix 程序 经 常 被 设计 成 一 组 子 程序 ,而 不 是 一 个 带 有 很 多 函数 的 大 程序 。 
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由 exec 传递 的 参数 必须 是 字符 串 。 由 于 进程 间 通 信 的 参数 类 型 为 字符 串 DOR eR 8 
了 子 程序 的 通信 也 必须 使 用 文本 作为 参数 类 型 。 几 乎 是 偶然 的 ,这 种 基于 文本 的 程序 接口 
支持 跨 平 台 的 交互 ,而 这 一 点 非常 重要 , 

2. 全 局 变量 和 fork/exec 

全 局 变量 是 有 害 的 , 它 破 坏 了 封装 原则 ,导致 出 人 意料 的 副作用 中 和 难以 维护 的 代码 。 
但 有 时 候 去 掉 全 局 变量 却 更 辅 糕 。 怎 么 才能 做 到 不 将 参数 变 得 复杂 的 情况 下 管理 一 堆 每 个 
人 都 要 用 到 的 变量 ? 尤其 是 必须 将 它们 向 下 传 几 层 的 时 候 , 情 况 会 更 加 麻 硕 。 

Unix 提供 方法 来 建立 全 局 变量 。 环 境 人 environment) 是 一 些 传 递 给 进程 的 字符 串 型 变 
量 集 合 。 不 会 有 副作用 , 它 对 fork/exec 和 exit/wait 机 制 是 一 个 有 用 的 补充 。 下 一 章 将 看 到 
它 如 何 王 作 和 如 何 使 用 它 ，。 | 


8.7 exit 和 exec 的 其 他 细节 


这 一 章 主 要 学 习 进 程 fork execvp 和 wait, 介 是 还 需要 再 多 了 解 一 些 关 于 exit 和 exec 
的 细节 。 


8.7.1 进程 死亡 : exit 和 _exit 


exit 是 fork 的 逆 操 作 , 进 程 通过 调用 exit 来 停止 运行 。fork 创建 一 个 进程 ,exit 删除 进 
程 。 基 本 上 是 这 样 。 

exit 刷新 所 有 的 流 , 调 用 由 atexit 和 on_exit 注册 的 函数 ,执行 当前 系统 定义 的 其 他 与 
exit 相关 的 操作 。 然 后 调用 _exit。 系 统 函 数 _exit 是 一 个 内 核 操 作 , 这 个 操作 处 理 所 有 分 配 
给 这 个 进程 的 内 存 , 关 闭 所 有 这 个 进程 打开 的 文件 ,释放 所 有 内 核 用 来 管理 和 维护 这 个 进程 
的 数据 结构 。 

子 进程 传 给 exit 的 参数 被 如 何 处 理 了 ? 那个 进程 的 弥留 之 言 被 存放 在 内 核 直 到 这 个 进 
程 的 父 进 程 通过 wait 系统 调用 取 回 这 个 值 。 如 果 父 进程 没有 在 等 这 个 信 , 那 么 它 将 被 保存 
在 内 核 真 到 父 进程 调用 wait , 那 时 内 核 将 通告 这 个 父 进 程 子 进 程 的 结束 ,并 转达 子 进程 的 弥 
BI. 

那些 已 经 死 T- 但 是 还 没有 给 exit RBS UE TE SUN Zo M Gombie ER. 1B d Hose gr 
的 版 本 的 ps 列 出 这 些 进程 并 标记 为 defunct。 

_exit() 小 结 如 下 。 

系统 调用 _exit 终止 当前 进程 并 执行 所 有 必须 的 清理 工作 。 这 些 工作 在 各 个 不 同 版 本 的 
(Unix 中 有 些 不 同 ,但 都 包括 以 下 一 些 操作 ，; 

OD 关闭 所 有 文件 描述 符 和 有 日 录 插 述 符 。 

(D 将 该 进程 的 PID BH init 进程 的 PID, 

(3) 如 果 父 进程 调用 wait 或 waitpid 来 等 待 子 进程 结束 , 则 通知 父 进 程 。 

(D 向 父 进程 发 送 SIGCHLD, 





D ”有些 人 人 认为 全 后 变量 会 学 至 错误 和 湛 乱 、 
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和 
_exit 





























目标 终止 当前 进程 
头 文件 H include <<unistd. h> 
# include << sidlib, h> 
me Rw void exitCint status) 
j 参数 status 返回 值 
返回 值 无 
相关 内 容 atexit(3) ,exit(3) ,on_exit(3) 


这 样 ,如 果 父 进程 在 子 进程 之 前 退出 ;那么 子 进程 将 能 继续 运行 ,而 不 会 成 为 "孤儿 ”, 它 
们 将 是 init 进程 的 “子女”, 这 有 点 像 孤 儿 由 国家 监护 。 注 意 , 就 算 父 进程 没有 调用 wait, AH 
也 会 向 它 发 送 SIGCHLD 消息 。 尽 管 对 SIGCHLD 消息 的 默认 处 理 方法 是 忽略 的 。 如 果 想 
响应 这 个 消息 ,可 以 设置 一 个 处 理 函 数 。 


8.7.2 exec 家 族 


在 已 经 实现 的 shell 中 和 例 程 中 用 execvp 来 演示 进程 是 如 何 运 行 一 个 程序 的 。execvyp 
不 是 一 个 系统 调用 , 它 是 一 个 座 函 数 , 这 个 岗 数 通过 系统 调用 execve 来 调用 内 核 服 务 。 
execve Hfj e 代表 环境 (environment) ,所 以 将 推 姑 到 下 一 章 来 讨论 它 。 

还 有 一 些 调用 execve 的 沙 数 也 是 有 用 的 。 下 而 是 这 个 家 族 中 的 一 些 成 员 ， 


- execlp(file argv0 ,argvl,..., NULL) 


execlp 不 像 execvp 那样 用 一 个 参数 数组 。 相反, 传 给 main 的 argv[] 中 包括 的 参数 被 简 
单 的 放 在 execlp 的 参数 中 。 酌 如 : 


exec p¢( "ls" È "ls" ; m_ a”, “demodir" , NULL) i 


以 指定 的 参数 运行 程序 ls。 当 预先 知道 要 运行 的 命令 和 它 的 参数 时 execlp 是 有 用 的 。 
但 是 在 shell 中 ,这 个 函数 没什么 用 ;因为 在 用 户 输入 命令 之 前 不 知道 有 多 少 参 数 ， 


exec] (fullpath,argv0,argvl,...,NULL); 


execlp 和 exeevp 中 的 代表 路 径 (path)。 这 两 个 函数 在 环境 变量 PATH 中 列 出 的 路 
径 中 查找 由 第 一 个 参数 指定 的 程序 ， 如 果 淮 确 知道 这 个 文件 的 位 置 ,那么 就 能 够 在 execl 中 
的 第 一 参数 中 指定 它 的 完整 路 径 。 例 如 : 


execl("/bin/1s","ls","— a", "demodir", NULL); 


f 


VA ise 88 BOK 3 TARP /vin/ls, tHe BUT ASE Or E Z fT execlp 更 快 。 朵 为 后 者 
要 在 路 径 中 查找 指定 程序 。 指 定 准 确 路 径 也 比 execlp 安全 。 如 果 环 境 变量 中 有 错误 的 路 径 
列表 ,那么 可 能 运行 错误 的 程序 。 


execv(fullpath, arglist) 
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除了 不 存 PATH 中 查找 程序 文件 外 ,execv 和 execvp 非常 相似 。 第 一 个 参数 必须 是 要 
执行 程序 的 完整 路 径 。 使 用 execv 或 exec! 来 执行 明确 指定 的 程序 比 依赖 安全 的 路 径 询 表 
PATH 更 安全 。 因 为 PATH 很 容易 被 恶意 的 用 户 算 改 。 


2. 


小 站 


,主要 内 容 


Unix 通过 将 可 执行 代码 载 人 进程 并 执行 它 来 运行 一 个 程序 。 进 程 是 运行 一 个 程序 
所 需 的 内 存 空间 和 其 他 资源 的 集合 。 

每 个 运行 中 的 程序 在 自己 的 进程 中 运行 。 每 个 进程 都 有 一 个 惟一 的 进程 DD、 所 有 
者 ,大 小 及 其 他 属性 。 

系统 调用 fork 通过 复制 进程 来 建立 一 个 几乎 和 原来 进程 完全 相同 的 副本 进程 。 这 
个 新 建 的 进程 被 称 为 子 进程 。 

一 个 程序 通过 调用 exec 晤 数 族 在 当前 进程 中 执行 一 个 新 的 程序 

一 个 程序 能 通过 调用 wait 来 等 待 子 进程 结 东 。 

调用 程序 能 将 一 个 字符 串 列 表 传 给 新 程序 的 main 函数 。 新 的 程序 能 通过 调用 exit 
来 回 传 一 个 8 位 长 的 值 。 

Unix shell 通过 调用 fork exec 和 wait 来 运行 程序 。 

进一步 的 问题 


shell 运行 程序 ,同时 shell 也 是 一 种 编程 语言 。 下 面 将 学 习 shell 的 脚本 语言 。 还 要 看 
看 如 何 修 改 程序 以 支持 脚本 .控制 逻辑 和 变量 。 


3. 


习题 


8.1 从 fork 返回 的 值 能 够 区 分 父 进 程 还 是 子 进程 ? 还 有 其 他 的 办 法 做 到 这 一 点 吗 ? 
8.2 预测 下 面 程序 的 输出 :; 


nain() 
i 
int n; 
for(n = 0; ni ; n4 4 
1 
printf("my pid = &d,n = 5e", getpidO , n); 


sleep(1); 
if (fork() t= 0) /* what if these two «/ 
exit(d); /* lines were removed «/ 


} 
} 


如 果 把 有 注解 的 两 行 删除 ,结果 又 会 如 何 ? 


8.3 psh2.c 使 用 了 定 长 的 数组 来 存放 参数 列表 。 如 何人 收 改 程序 才能 去 掉 用 户 输入 命 


令 参 数 个 数 的 限制 ? 这 样 的 改动 有 必要 吗 ? 这 就 是 说 ,Unix 是 否 限制 了 exec 可 
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接受 的 参数 长 度 或 个 数 ? 
8.4 考虑 以 下 代码 : 


main() 

{ aint fd; 
int pid; 
char msgl[ | = "Test 123 ..\n"; 
char msg2[] = "Hello, hello\n"; 


if ( (fd = creat(tesefile, 0644)) == - 1} 
return 0; 
if ( write(fd, msgl, strlen(msql)) == -1) 


return Q; 


if ( (pid = fork()) == - 1) 
return 0; 

if ( write(fd, msg2, strlen(msg2)) == -1) 
return 0; 

clase( fd}; 


return l; 


4 


MARTER. a AD fork 之 后 两 个 进程 都 有 一 个 指向 同一 个 输出 文件 并 日 具有 
相同 的 当前 位 置 的 文件 描述 符 。 文 件 中 会 有 坊 条 记录 ? 能 否 从 记录 的 条 数 得 知 
文件 描述 符 和 连接 的 文件 ? 


8.5 考虑 下 面 代 码 ; 


# include < stdio. h> 


main) 
1 
FILE * fp; 
int pid; 
char msgl[] = "Test123 .An 
char msg2; = "Hello, helloXn"; 
if ( (fp = fopen("testfile2", "w")) == NULL) 
return 0; 


fprintf(fp, "& s", msgl); 
if( (pid = fork()) == -1) 
return 0; 
fprintf(fp," € 5" msgz); 
fclose(fp): 
return 1; 
} 


测试 这 个 程序 。 文 件 中 有 多 少 条 记录 ? 解释 一 下 结果 。 将 这 个 程序 的 输出 与 课 
本 中 的 forkdemol. c 的 输出 比较 一 下 。 
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8.6 编译 并 运行 以 下 程序 
main) 
1 
int i; 
if (fork 1= 0) 
exit(0); 
for( i=1 ; i= 10 itt yt 
printf("still nere.. \n"); 
sleep (id: 
return 0; 
i 
解释 程序 做 了 些 什么 ,怎么 工作 的 ,Unix shell 多 许 用 户 在 后 台 运 行程 序 。 这 个 程 
序 与 后 人 台 进 程 有 什么 相似 之 处 ? 


8.7 ”如 果子 进程 运行 失败 ,程序 调用 exit。 调 用 exit 看 起 来 很 极端 。 为 什么 不 仅仅 从 
函数 中 返回 出 错 代码 ? 


4. 编程 练习 

8.8 扩展 waitdemol.c 的 功能 ,使 之 建立 两 个 进程 ,并 等 待 两 个 进程 都 结束 。 
进一步 扩展 你 的 程序 使 之 能 从 命令 行 接受 整数 。 然 后 程序 创立 该 整数 指定 的 进程 数 。 
分 配 每 个 进程 一 个 随机 的 睡眠 时 间 。 最 后 , 父 进程 报告 每 个 子 进 程 的 退出 。 


8.9 写 个 程序 来 帮助 理解 SIGCHLD。 人 修改 waitdemo2. e, 设置 SIGCHL D 信和 号 的 处 理 
杖 数 。 然 后 执行 循环 ,每 一 秒 打印 一 次 "waiting"”。 当 子 进 程 退 出 ,程序 打印 消息 ， 
报告 退出 原因 然后 退出 。 


8.10 罕 一 个 程序 接受 一 个 整数 作为 参数 ,然后 创建 参数 指定 个 数 的 子 进 程 。 每 个 子 
进程 睡眠 5 秒 钟 ,然后 退出 ， 父 进程 设置 SIGCHLD 的 信和 号 处 理 函 数 。 然 后 进 人 
循环 ,每 秒 打 印 一 次 消息 。 信 和 号 处 理 函 数 调 用 wait, 然 后 打印 子 进程 的 ID, 最 后 
将 计数 器 增 1。 当 计数 器 达到 建立 的 子 进程 数 时 ,程序 退出 。 月 不 同 数 是 的 子 进 
程 数 来 测试 程序 。 当 子 进程 数 很 大 时 程序 可 能 会 丢失 -~ 些 子 进程 送出 的 消息 ， 
能 解释 为 什么 会 有 消息 持 失 吗 ? 有 没有 办 法 解决 ? 


8,11. 修改 psh2.c 使 之 在 用 户 输入 "exit 或 遇 到 文件 结束 时 退出 。 


8.12 当 有 子 进程 在 运行 时 ,标准 Unix shell 存 用户 发 送 中 断 或 退 册 依 号 时 并 不 终止 。 
接受 命令 行 时 ,标准 的 Unix shell 如 何 响应 这 些 信号? 修改 psh2. ec, 使 之 像 一 个 
标准 的 shell 那样 了 工作， 
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概念 与 技巧 

* Unix shell 是 一 种 编程 语言 

« 什么 是 shell 脚本 语言 ? shell 如 何 处 理 脚本 语言 ? 
* shell 如 何 处 理 结 构 化 的 工作 ? exit(0) = success 
* 为 什么 需要 shell 变量 以 及 如 何 使 用 shell 变量 

。 什么 是 环境 ? 它 是 如 何 工 作 的 ? 

相关 的 系统 调用 

* exit 

* getenv 

相关 命令 


* env 


9.1 shell 编程 


在 shell 中 可 以 运行 程序 ,而 shell 本 身 就 是 一 种 编程 语言 。shell 程序 ,一 般 称 之 为 shell 
脚本 ,是 Unix 的 重 此 部 分 ,Unix 的 引导 称 序 和 很 多 管理 程序 都 使 用 shell WA. ABH, A 
先 学 习 shell 的 编程 特征 。 然 后 在 上 一 章 编写 的 shell 程序 中 增加 一 些 特征 ,将 让. then 控制 
语句 .局 部 变量 和 全 局 变量 添加 到 要 实现 的 shell 程序 中 。 


9.2 什么 是 以 及 为 什么 要 使 用 shell 脚本 语言 


shell 是 一 个 编程 语言 解释 器 ,这 个 解释 器 解释 从 键盘 输入 的 命令 ,也 解释 存储 在 脚本 中 
的 命令 序列 。 | 


shell 脚本 包含 一 系列 命令 
shell 彩 本 是 一 个 包 售 一 系列 命令 的 文件 。 运 行 一 个 脚本 就 是 运行 这 个 文件 中 的 每 个 命 
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。 可 以 用 … 个 shell 脚本 在 一 次 请 求 中 来 执行 多 个 命令 。 下 面 是 一 个 例子 : 


# this is called scriptÜ 

# it runs some commands 

ls 

echo the current date/time is . 
date 

echo my name is 


whoami 


前 两 行 是 注释 shell BORAT TF OT MEAT TT AAR RU AS P BB ot HL > A, shell 逐条 


执行 命令 直到 文件 末尾 或 者 shell 执行 到 exit 命令 ， 


可 以 把 脚本 文件 名 作为 参数 传 给 shell 来 执行 脚本 : 


5 sh scriptÜ 

Script0O scriptl script2 script3 
the current date/time is 

Sun Jul 29 23:29:49 EDT 2001 

my name is 

bruce 


$ 
还 可 以 通过 设置 文件 的 执行 权限 ,然后 输入 文件 名 来 执行 脚本 : 


$ chmod + x scripto 

$ scripto 

scriptů scriptl Script? script3 
the current date/time is 

Sun Jul 29 23:31;,23 EDT 2001 

my name is 

bruce 


$ 


对 于 一 个 脚本 只 需要 执行 一 次 chmod, 可 执行 位 将 保持 不 变 直到 下 一 次 再 改变 它 。 用 第 


二 种 方法 ,也 就 是 用 改变 文件 可 执行 属性 的 方法 来 启动 邯 本 会 更 加 方便 。 将 脚本 设置 成 可 
执行 的 ,然后 像 运 行 系统 命令 或 自己 编写 的 程序 一 样 来 执行 脚本 。 


将 使 用 哪个 shell? 我 们 将 学 习 和 编写 脚本 的 shell 是 一 个 早期 版 本 的 Unix shell; sh 的 


语法 , 它 被 称 为 B shell(Bourne Shell) ,这 是 根据 编写 这 个 程序 的 人 的 名 宇 来 命名 的 。 过 去 
的 几 年 中 有 很 多 不 同 的 shell 被 实现 ,它们 各 有 各 的 特点 或 语法 。 这 里 将 学 习 的 语法 在 大 多 
数 shell 中 是 相同 的 ,包括 sh, bash 和 ksh, 


l. sh 章 编 程 特征 :变量 、I1/O 和 if.. then 
shell 脚本 是 真正 的 程序 。 注 意 在 script? 中 体现 的 特点 ， 
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41 /bin/sh 
3$ script2 : a real program with variables, input, 


# and control flow 


BOOK = $HOME / phonebook. data 
echo find what name in phonebook 
read NAME 
if grep $ NAME $ BOOK > /tmp/pb. tmp 
then 

echo Entries for $ NAME 

cat /tmp/pb. tmp 
else 

echo No entries for $ NAME 
fi 
rm /tmp/pb. tmp 


下 面 是 script2 的 和 输出， 


S ./Script2 

find what name in phonebook 
dave 

Entries for dave 

dave 432 - 6546 

$ ./script2 

f ind what name in phonebook 
fran 

No entries for fran 

$ cat SHOME/phonebook. data 


ann 222 - 3456 

bob 323 - 2222 

carla 123 — 4567 

dave 432- 6546 

eloise 567 — 9876 

$ 

BAR BRT dir Sb LIGA F GR . 
(1) 变量 


脚本 中 可 以 定义 变量 。 在 script2 中 ,定义 了 名 为 BOOK 和 NAME 两 个 变量 ,并 在 定义 
之 后 使 用 了 它们 ,用 前 级 $ 来 取得 变量 的 值 。 变 量 各 不 一 定 要 大 写 , 只 是 习惯 上 将 其 大 写 。 

《2) 用 户 输 人 

read 命令 告诉 shell 要 从 标准 输入 中 读 人 一 个 字符 串 。 可 以 使 用 read 3 gaz 8 00 
本 :也 可 以 从 文件 或 管道 中 读 人 数据 。 

(3) 控制 

这 个 脚本 包括 了 if.. then.. else. .下 控制 语句 。 其 他 的 脚本 控制 语句 还 有 while. case 
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AQ for. 

(4) 环境 

脚本 使 用 一 个 名 为 HOME 的 变量 。HOME MARKER RABE. HOME 变量 是 
由 login 程序 设置 的 ,可 以 被 login 进程 的 所 有 子 进程 使 用 。HOMEF 变量 是 多 个 环境 变量 
Cenvironment variables) 中 的 一 个 。 这 些 环境 变量 记录 了 个 性 化 设置 。 而 这 些 设 置 能 影响 很 
多 程序 的 行为 ， 比 如 ,TZ 变量 记录 了 当前 的 时 区 。 将 TZ 设置 为 "EST5EDT" 是 告诉 那些 使 用 
ctine 的 程序 ,比如 date Mls -1 应 该 显示 美国 东部 时 间 。 本 章 后 面 会 学 习 环 境 变量 的 作 
用 和 结构 。 

2， 自 编 shell 的 改进 

在 上 一 章 用 fork ,execvb 和 wait 实现 了 一 个 能 够 创建 进程 各 运行 程序 的 shell。 本 章 
中 ,将 对 这 个 shell 做 一 些 改 进 。 首 先 , 将 加 和 命令 行 解析 。 这 样 用 户 就 能 够 在 一 行 中 输入 命 
令 和 所 有 参数 了 ， 然 后 ,将 控制 语句 if . then 加 人 到 这 个 shell 中 。 最 后 将 加 人 局 部 变量 和 
环境 变量 ， 


9.3 smshl 一 一 命令 行 解析 


AYA a shell 的 第 一 个 改进 是 添加 命令 行 解析 的 功能 。 这 个 版 本 命名 为 smshl, c。 用 户 
现在 可 以 在 一 行 中 输入 ,比如 : 


find /home — name core - mtime +3 - print 


然后 由 解析 器 将 命令 行 拆 成 字符 串 数 组 ,以 便 传 给 execvp。 程 序 主要 流程 如 图 9. 1 所 示 。 
对 psh2. c 的 改进 包括 将 命令 行 分 解 成 参数 数组 ,在 shell 中 忽略 信和 号 SIGINT 和 SIGQUIT， 
(ERT ite PKS {AS SIGINT 和 SIGQUIT 的 默认 操作 ,允许 用 户 通过 按 表 示 结 束 文 
件 的 Ctrl- D KRH. 








ignore signals 
— — —* get command —— 一 一 — éxit 
split line 
| 

| fork 一 

| 

wait enable signals 
execvp 








E | 
L| i 


图 9.1 一 个 有 信号 , 通 出 和 解析 的 shell 
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shell H £ ARAN F 


int main() 

{ 
char x* cmdline, * prompt, * * arglist; 
int result; 


void setup; 


prompt = DFL_PROMPT ; 
setup(): 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL j| 
if ( (arglist = splitline(cmdline)) ! = NULL | 
result = execute(arglist); 
freelist(arglist); 
} 
free( cmdline}; 


) 


return 0; 


} 


3 个 函数 的 解释 如 下 。 


(1) next_cmd 





next cmd 从 输入 流 中 读 和 人 下 一 个 命令 。 它 调用 malloc 来 分 配 内 存 以 接受 任意 长 度 的 


命令 行 。 磁 到 文件 结束 符 , 它 返回 NULL, 
(2) splitline 


splitline 将 一 个 字符 捉 分 解 为 字符 捉 数组 ,并 返回 这 个 数组 。 安 调用 malloc 来 分 配 内 存 


以 接受 任意 参数 个 数 的 命令 行 。 这 个 数组 由 NULL 标记 结束 。 


(3) execute 


execute 使 用 fork .execvp 和 wait 来 运行 一 个 命令 。execute 返回 命令 的 结束 状态 
smshl 由 3 个 文件 组 成 :smshl.c,splitiine. c 和 execute.e。 用 以 下 命令 来 编译 和 运行 这 


TE: 


$ co smshi.c splitline.c execute.c - o smshl 

S . /snshl 

>ps -f 

UID PID PPID C STIME TTY TIME CHD 
bruce 23203 23199 0 Jui29 pts/4 00:00-00 bash 
bruce 25383 23203 0 08:23 pts/4 00:00:00 . {sushi 
bruce 25385 25383 0 08:23 pts/4 00:00-00 ps -f 
DER ARR Ctrl-D 

$ 


注意 ps 一 上 是 . /smshl 的 子 进 程 。 /smshl 是 bash 的 子 进 程 。 下 面 是 smshl.c HIRE: 
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f** smshl.c small- shell version i 
x first really useful version after prompting shell 
rd this one parses the command line into strings 
He uses fork, exec, wait, and ignores signals 
xe f 


# include <cstdio. h> 

# include <cstdlib. h> 
H include <Lunistd. h>> 
# include «signal. h> 


# include “smsh. h" 


# define DFL PROMPT ">" 


int main() 

{ 
char * cmdline, * prompt, x x arglist; 
int result; 
void setup(?; 


prompt - DFL PROMPT ; 
setup(; 


while ( (cmdline = next comd(prompt, stdin)) |= NULL ){ 
splitline(cmdline)) | = NULL ){ 
result = execute(arglist) ; 


if ( (arqlist 


freelist(arglist); 
} 
free(cmdline); 


} 


return 0; 


void setup() 
ix 
* purpose; initialize shell 
* returns: nothing. calls fatal() if trouble 
xf 
1 
signal(SIGINT, SIG_IGN); 
signal(SIGQUIT, SIG IGN); 
] 


void fatal(char * sl, char * s2, int n) 
t 
fprintf(stderr, "Error: % s, sin", s1, s2); 


exit(n) ; 
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下 面 是 execute. c 的 代码 ; 


/* execute.c — code used by small shell to execute commands */ 


# include Xstdio. ho 

# include <stdlib.h> 
# include  «unistd.h— 
d include <<signal. hi> 


# include <sys/wait. h> 


int execute(char * argv[ j) 
fr 
* purpose; run a program passing it arguments 
* returns; status returned via wait, or —1 on error 


* errors: — l on fork() or wait() errors 


«/ 
1 
int pid ; 
int child info = ~1; 
if (argv[0] == NULL) /* nothing succeedsxs/ 


return 0; 


if t (pid = fork()) == -1) 
perror( "fork"; 
else if ( pid == 0 >¢ 
signal(SIGINT, SIG DFL); 
signal(SIGQUIT, SIG DFL); 
execvp(argv[0,, argv); 
perror("cannot execute command"); 
exit(1); 
j 
else | 
if ( wait(&child info) == -1) 
perror("wait"); 
} 


return child info; 


Fi splitline.c 的 代码 : 


/* splitline.c — commmand reading and parsing functions for smsh 
* 
x char * next cmd(char * prompt, FILE x fp) 一 get next command 
# char ** splitline(char * str); - parse a string 
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x/ 


£ include -—stdio. h> 
d include «stdlib. h> 
# include «string. K> 


# include "smesh. h" 


char * next cmd(char » prompt, FILE * fp) 
/党 
* purpose: read next command line from fp 
* returns. dynamically allocated string holding command line 
* errors; NULL at EOF (not really an error) 
* calls fatal from emalloc() 


* notes; allocates space in BUFSIZ chunks. 


xj 

i 
char x buf > /* the buffer x/ 
int bufspace = 0; /* total size «/ 
int pos = 0; /* current position xy 
int €; /« input char */ 
printf("$ s", prompt); /* prompt user */ 


while( ( c = gete(fp}) t= EOF) { 


/* need space? »/ 
if( post 1 “>= bufspace ){ /* 1 for X0 x 
if ( bufspace == 0} /* y: 1st time «/ 
buf = emalloc(BUFSIZ); 
elsé or expand #/ 
buf = erealloc( buf ,bufspace + RUFSIZ); 
bufspace += BUFSIZ; /* update size x/ 


me 


/* end of command? x/ 
if (ce == 'in!') 
break; 


/* no, add to buffer «/ 
buf[post++ | = c; 

1 

if (c == EOF && pos == 0) /* EOF and no input «/ 
return NULL; /* say so #7 

buf[pos] = 'A6'; 


return buf; 
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sx splitline ( parse a line into an array of strings ) 
wef 
# define is delim(x) (Q0 == #|i(x)== "AE O 


char # splitline(char * line) 
{* 
x purpose: split a line into array of white - space separated tokens 
x returns;a NULL - terminated array of pointers to copies of the 
* tokens or NULL if line if no tokens on the line 
* action; traverse the array, locate strings, make copies 


* note: strick() could work, but we may want to add quotes later 
#/ 


char  * newstr(); 


char  ** arqs; 


int spots = 0; /* spots in table «/ 
int bufspace - 0; : /* bytes in table */ 
int argnum = 0; /* slots used */ 
char * cp = line; /* pos in string +f 


char * start; 


int len; 

if (line == NULL ) /* handle special casex/ 
return NULL; 

args = emalloc(BUFSIZ); /* initialize array*/ 


bufspace = BUFSIZ. 
spots = BUFSIZ/sizeof(char +»); 


while( *cp f= Or ) 
1 


while ( is delim( * cp) ) /* skip leading spaces ¥/ 
cptt ; 

if ( *cp == "\o") /* quit at end-o- string #/ 
break; 


/* make sure the array has room ( +1 for NULL) «/ 
if ( argum + 1 >= spots }{ 
args = erealloc(args,bufspace + BUFSIZ); 
bufspace += PUFSIZ; 
spots += (BUFSIZ/sizeof(char x); 
} 


/* mark start, then find end of word »/ 
start = cp; 
len = 1; 


f 


while (#++cp]= 'X0*' && 1 (is delim( » cp)? ) 
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len 十 十 ， 
args[argnum ++ ] = newstr(start, len); 
} 
args[argnum] = NULL; 
return args; 


} 
fe 


* purpose; constructor for strings 
* returns; a string, never NULL 
EFi 

char # newstr(char x s, int 1) 

1 


char *rv = emalloc(1 +1); 


rv[1] = NO 


sLrncpy(rv, s, l); 


, , 


return rv; 


} 


void freelist(char xx list) 
ix 
* purpose: free the list returned by splitline 
* returns: nothing 
* action; free all strings in list and then free the list 
xf 
1 
char **cp = list; 
while( x cp? 
free( xcp++}; 
free(list); 
} 


void + emalloc(size t n) 
1 


void * rv; 
if ( (rv = malloc(n)) == NULL) 

fatal("out of memory", "" 1); 
return rv; 


} 


void * erealloctvoid x p, size t n) 


{ 
void * rv; 
if ( (rv = realloc(p,n)) == NULL) 
fatal("realloc() failed","",1); 


return rv; 
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} 
下 面 是 smsh.h 的 代码 ，; 


# define YES 1 
Hdefine NO 0 


char * next_cmd(); 

char  ** splitline(char +); 

void freelist(char **); 

void * emalloc(size t); 

void  * erealloc(void * , size t); 
int execute(char s*); 


void fatal¢char + , char * , int); 


关于 smshl 的 解释 


smshl 比 psh2 要 好 用 很 多 ,改进 的 方面 主要 包括 以 下 一 些 : 
(e -- 行 多 个 命令 
通常 的 shell 允许 用 分 号 分 隔 命 令 , 这 样 用户 就 可 以 在 一 行 中 输入 多 个 命令 了 


ls demodir; ps -f ; date 


(2) Ja fut fe 
通常 的 shell 允许 用 户 通 过 在 命令 的 结尾 加 上 与 符号 (&&) 来 使 其 在 后 台 运 行 , 如 : 





find /home - name core print & 


在 后 台 运 行 一 个 程序 意味 着 一 旦 启动 它 ,系统 将 立即 返回 提示 符 , 这 个 进程 可 能 还 没有 
结束 ,但 已 经 是 以 在 提示 符 后 输入 命令 并 运行 其 他 进程 了 。 这 听 起 来 有 点 复杂 ,实际 上 实现 
是 非常 简单 。 看 看 流程 图 , 想 想 是 旭 何 不 等 待命 令 结束 调 返 加 提示 符 的 。 想 法 很 简单 而 日 
漂亮 ,但 是 要 处 理 信 号 和 防止 候 忆 (Zombies) 进 程 ,这 有 点 像 惊 险 片 。 

(3) 退出 命令 

E T$ 89 shell 多 许 用 户 通 过 输入 exit 来 退出 shell, exit 命令 接受 一 个 整数 参数 ,比如 
exit 3, 这 种 情况 下 ,这 个 数字 被 作为 参数 传 给 exit HR. 


9.4 shell 中 的 流程 控制 


对 原 有 的 shell 的 第 2 个 改进 是 增加 if.. then 控制 语句 。 
9.4.1 证 语句 做 些 什么 
shell 提供 if 控制 语句 。 假 设 你 计划 每 周 五 做 磁盘 备份 考虑 -下 以 下 例子 ， 


if date|grep Fri 
then 





第 9 章 可 编程 的 shell, shell 变量 和 环境 ;编写 自己 的 shell * 271 * 





echo time for backup. Insert tape and press enter 
read x 
tar cvf /dev/tape /home 

fi 


shell 中 的 过 庄 名 的 作用 与 其 他 语言 的 if 语句 相同; 条 件 检测 。 如 果 条 件 的 值 为 正 , 则 有 
一 部 分 代码 被 执行 。 在 shell 中 ,条件 是 一 个 命令 ,返回 正 值 意味 着 命令 运行 成 功 。 

在 例子 中 ,命令 是 date| grep Fri, 这 个 命令 在 date 的 输出 字符 串 中 查找 “Fri” 字 符 串 ,如 
” 果 找 到 则 命令 成 功 ,否则 命令 失败 。 程 序 是 如 何 形 示 成 功 的 呢 ? 

C1) exit(O FRR MY 

grep UF JS PAM exit(OR RAM. BAA Unix 程序 都 遵从 以 0 退出 表明 成 功 这 
-- 惯 例 ， 比 如 ,diff 命令 用 来 比较 两 个 文本 文件 。 如 果 两 个 文件 相同 ,ditt 返回 0 以 表明 成 
W. KM, mvp 和 rm 都 以 相同 的 方式 表明 成 功 。 和 脚本 中 的 让 .then 语 名 基于 以 0 退出 
表示 成 功 这 个 假设 。 

(2) ŒJ] else 的 让 语句 

一 个 并 语句 可 以 有 else 部 分 ,比如 : 


ls 

who 

if diff filel filel. bak 

then 
echo no differences found, removing backup 
rm filel. bak 

else 
echo backup differs, making it read~ only 
chmod -w filel.bak 

fi 

date 


else 部 分 就 像 then 部 分 一 样 ,可 以 包含 任意 数量 的 命令 ,包括 其 他 的 if. then 语句 
计 语 名 还 有 另 一 个 特征 。 如 果 计 后 的 条 件 是 一 系列 的 命令 ,那么 最 后 一 个 命令 的 exit 值 
被 用 作 这 个 语句 块 的 条 件 值 , 并 由 此 来 决定 条 件 是 否 成 立 。 


9.4,2 证 是 恕 何 工作 的 


if 语句 的 工作 流程 主要 如 下 。 

(12 shell 运行 if 之 后 的 命令 。 

(2) shell 检查 命令 的 cxit RA. 

(3) exit 的 状态 为 0 意味 着 成 功 , 非 0 意味 着 失败 。 
(4) 如 果 成 功 ,shell 执行 then 部 分 的 代码 。 

(5) 如 果 失 败 ,shell 执行 else 部 分 的 代码 。 

(6) XE fi ik RNR. 
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一 … 


9.4.3 在 smsh rp in if 


现存 已 经 知道 [控制 语句 做 什么 ;也 知道 它 是 如 何 二 作 的 。 那 么 如 何在 shell rst An if 
语句 呢 ? 

这 里 已 经 知道 如 何 运行 ~- 个 命令 一 一 调用 exeeute。 也 知道 如 何 和 检查 一 个 程序 的 如 出 状 
态 一 - -从 wait 函数 中 得 到 。 需 要 将 让 之 后 命令 的 结果 存放 在 一 些 变量 中 ,然后 要 知道 后 面 
恋人 的 命令 是 在 then 块 中 ,还 是 else 块 中 。 最 后 还 得 确保 在 于 之 后 读 人 then, 

CD 增加 一 层 :proeess 

要 实现 这 些 功能 ,原来 的 模型 就 有 些 太 简 单 。smshl 的 控制 流 从 splitline 直接 到 fork, 
每 个 命令 都 被 直接 传 给 exec, BAMA UW if then 或 者 五 开始 的 行 和 条 件 失败 时 then 语 
名 块 中 的 命令 行 不 传 给 exec。 添 加 if 语句 后 使 命令 处 理 变 得 复 架 ,所 以 要 写 一 个 名 为 
process 的 函数 来 包含 这 些 复杂 的 代码 。 修 改 后 的 流程 图 如 图 9.2 所 示 。 


smshi smsh2 
ignore signals ignore signals 

-一 -二 getcommand ——-» exit r- —» get command —— —» exit 

| split line | split line 

| 1 | conical command? 

— fork 一 一 
F | |" 

| wait enable signals | f 一 fork —-— 

l 
*— execvi 

| | MP | enable signals 方 框 内 是 函数 

| | n | execvp process 

| 4 at exit | 





图 9.2 在 smsb 中 增加 流程 控制 


(2) process fiib f+ 4 

process 通过 寻找 关键 字 ,比如 ithen 和 fi: 来 管理 脚本 流程 ,在 适当 的 时 候 调用 fork 和 
exec, process 必须 记录 条 件 命令 的 结果 以 便 能 够 处 理 then Al else B. 

(3) procss 是 如 何 工作 的 ? 代码 区 域 . 运 行 状态 

process 将 脚本 看 作 一 个 接 一 个 的 代码 区 域 。 第 1 个 区 域 是 then 代码 块 ,第 2 PA else 
代码 块 , 第 3 个 是 在 AMS ER, MRA 9. 3 所 示 , 对 于 不 同 的 区 域 ,shell 的 处 理 
方法 也 是 不 同 的 。 

考虑 计 语 名 之 外 的 区 域 , 这 里 称 之 为 中 立 区 (neutral) 。 对 于 这 类 区 域 的 代码 ,简单 地 读 

接 下 来 是 在 if then 之 问 的 区 域 。 这 个 区 域 中 ,shell 每 执行 一 条 命令 就 记录 下 它 的 退 
出 状态 , 另 一 个 区 域 是 从 then 38 fi gk else Z fa] RIG — P RRMEM else B fi, fi ZANE. 
到 中 立 区 了 ， l 

shell 记录 当前 区 域 类 型 ,还 必须 记录 在 WANT THEN 区 域 中 所 执行 命令 的 结果 。 
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区 域 


mra [x 
want-then 
then-block 


else-block 


中 立 区 


shell 的 输入 序列 








Is 
who 
if diff file) filel bak 
then 
rm filei.bak 
echo removing backup 


else 
chmed -w filel_ bak 


图 9. 3 由 不 同 区 域 组 成 的 脚本 


不 同 区 域 的 处 理 方法 是 不 同 的 。 特 定 的 区 域 与 程序 的 特定 状态 联系 在 一 起 。proeess 通 
过 3 个 函数 来 处 理 区 域 问题 ，。 

(1) is control command ` 

is control command 返回 一 个 boolean 变量 告诉 process 这 条 命令 是 脚本 语音 的 一 部 分 
还 是 一 条 可 执行 的 命令 ， 

(2) do, control command 

do control command 处 理 关 键 字 if then M fi. 每 个 关键 字 痢 是 区 域 的 界 标 ， 这 个 函 
数 更 新 状态 变量 并 执行 必要 的 操作 。 

(3) ok, to execute 


ok. to. execute 根据 当前 的 状态 和 条 件 命令 的 结果 返回 一 个 boolean 值 ,说 明 能 宕 执行 


当前 命令 。 


9.4.4 smsh2.¢: 修 改 后 的 代码 


smsh2. c 是 基于 smshl.c HJ, main 岗 数 只 有 一 处 需要 改动 一 一 调用 execute 的 地 方 调 


用 process 了 : 


/** smsh2.c - small- shell version 2 


et small shell that supports command line parsing 


x and if.. then. . else. fi logic (by calling process()) 


ue if 

# include 
l # include 

# include 

# include 

# include 

# include 


<{stdio. h> 
<stdlib.h> 
<unistd. h> 
<signal. h> 
< syg/ wait. h> 


"snsh. h" 


# define DFL PROMPT "> " 


int maing) 
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char x cmdline, x prompt, x * arglist; 
int result, process(char ** }; 


void setupO; 


prompt = DFT, PROMPT ; 
setup(); 


while ( (cmdline = next cmd(prompt, stdin)) |= NULL | 
if ( Carglist = splitline(cmdline)) | = NULL 4 
result = process(arglist): 
freelist(arglist); 
} 
,! free(cmdline) ; 


} 


return 0; 


void setup} 
j 
* purpose; initialize shell 
* returns; nothing. calls fatal() if trouble 
xf i 
i 
signal(SIGINT, SIG_IGN}; 


signal(SIGQUIT, SIG IGN); 


void fatal(char *s1, char *s2, int n) 
i 
fprintf(stderr,"Error; $s, $ sin", sl, $2); 


exitíin); 


还 添加 了 两 个 新 文件 ,process. c A! controlflow. c; 


/* process.c 
* command processing layer 
T 
* The process(char » * arglist) function is called by the main loop 
* It sits in front of the execute() function. This layer handles 
x two main classes of processing: 
* a) built- in functions (e.g. exit(), set, =, read, .. ) 


* b) control structures (e.g. if, while, for) 


* / 


i include <stdio.h> 





* 275 œ 





9% 可 编程 的 shell shell 变量 和 环境 :编写 自己 的 shell 





H include  "smsh.h" 


int is control command(char *); 
int do control command(char #+» ); 


int ok to execute(); 


int process(char ** args) 
fe 
* purpose: process user command 
* returns; result of processing command 
* details: if a built - in then call appropriate function, if not 
'execute() 
* errors: arise from subroutines, handled there 


xf 


int rv = 0; 


if (args[0; == NULL) 
rv = Q; 
else if ( is control command(args[0]? ) 
rv = do control command(args); 
else if ( ok to execute() } 
rv - execute(args) ; 


return rv; 
/* controlflow.c 


* "if" processing is done with two state variables 
x if state and if result 

x/ : 

d include  «stdio. h> 


itinclude  "smsh.nh" 


enum states { NEUTRAL, WANT THEN, THEN BLOCK } ; 
enum results | SUCCESS, FAIL }; 


static int if state = NEUTRAL; 
SUCCESS ; 
Q- 


static int if result 


static int last stat 
int syn err(char *); 


int ok to execute() 

ix 
* purpose: determine the shell should execute a command 
x returns; 1 for yes, 0 for no 


* details : if in THEN BLOCK and if result was SUCCESS then yes 
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x if in THEN BLOCK and if result was FAIL then no 
x if in WANT_THEN then syntax error (sh is different} 
*/ 
i 
int rv = is /* default is positive x/ 


if ( if state == WANT THEN 5| 
syn err( "then expected"); 


rwv = 0; 

} 

else if ( if state == THEN_BLOCK £& if result == SUCCESS ) 
ry = 1; 

else if ( if state == THEN BLOCK && if result == FAIL) 
rv = 0; 


return rv; 


int is control command(char x s) 
fx 
* purpose; boolean to report if the command is a shell control command 
* returns; 0 or 1 
xf 
i 
return (strcmp(s,"if")--0 || stremp(s, "then"? ==0 || 


stremp(s,"fi")-20); 


int do control command(char x** args) 
fx 
* purpose: Process "if", "then", "fi" — change state or detect error 
* returns; 0 if ok, — 1 for syntax error 
x/ 
1 
char  *cmd = args[0]; 


intrv = 一 1， 


r 


if ( strempíemd, Mif") 一 = 日) 
if ( if_state | = NEUTRAL ) 
rv = syn err("if unexpected"): 


else | 


last stat = process(args + 1); 
if result = (last stat == 0 ? SUCCESS : FAIL); 
if state - WANT THEN; 


rv = 0; 
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else if ( stremp(cnd, "then"? == 0 ){ 
if ( if state | = WANT THEN ) 
fV 7 syn err("then unexpected"); 


else { 
if state = THEN BLOCK; 


me 


else if ( strcmp(omd, "fi") 2-0); 
if ( if state |= THEN BLOCK ) 


rv = gyn err("fi unexpected") - 


else | 
if state - NEUTRAL; 
rv = D; 
; 
} 
else 


fatalt “internal error processing;", cmd, 2); 


return rv. 


} 


int syn err(char # msg) 
/* purpose: handles syntax errors in control structures 
x details: resets state to NEUTRAL 
x returns; — 1 in interactive mode. Should call fatal in scripts 
x/ 
{ 
if state = NEUTRAL; 
fprintf(stderr, "syntax error: % sin", mso); 


return - 1; 


在 controlflow. c 中 ,让 语句 的 else 没有 罐 处 理 , 这 一 部 分 留 作 读者 的 习题 。 
编译 并 执行 这 个 版 本 : 


$ co -o smsh2 smsh2.c splitline.c execute. c process. c controlflow.c 
å ./smshZ 

= grep lp /etc/passwd 
lpix:4-7:lp:/var/spool/lpd; 
‘> if grep lp /etc/passwd 
1p:x:4:7 :1p:/var/spool/lpd: 
> then 

=> echo ok 

ak 


o> Fi 
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~ if grep pati /etc/passwd 
“> then 

“> echo ok 

> fi 

“> echo ok 

ok 

<> then 


syntax error: then unexpected 


做 得 如 何 ? 


看 起 来 做 得 不 错 。 那 么 和 常用 的 shell EER X. n fuf Je ? 


if grep lp ‘etc/passwd 
then 

echo ok 
fi 


XO X im din 


lp:x:4d;7;:lp:/var/spool/lpd; 
ok 
$ 


这 个 shell 处 理 让 语句 的 方法 和 刚才 的 实现 有 些 不同 。 标 准 的 shell c EJ fi E 
地 执行 i, RAE ARMA? 为 什么 要 这 公敌 呢 ? 常用 的 shell S fair E R if 
语句 ,这 里 的 程序 能 做 修改 以 支持 檬 塞 的 过 庄 句 吗 ? 


9.5 


shell 变量 :局 部 和 全 局 


像 其 它 的 程序 诺言 一 样 ,Unix shell hE. 能 对 这 些 变量 赋值 ,也 可 从 这 些 变量 反 


值 , 列 出 所 有 变量 ,例如 以 下 的 代码 : 


$ age-7 

5 echo S age 

T 

$ echo age 

age 

$ echo $ age* $ age 

7+ 7 

$ read name 

fido . 

$ echo hello, 5 name, how are you 
| hella, fide, how are you 

s ls > $ name. 5 age 

$ food - muffins 

food:not found 

5 


#assiqming a value 


# retrieving a value 


#the s is required 


i purely string operations 


4 input from stdin 


# can be interpolated 


# used as a part of a command 


4 no spaces in assignment 
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shell 包括 两 炎 变 量 ; 局 部 变量 和 环境 变量 。 在 前 面 提 到 过 了 , 像 HOME 和 TZ 这 样 的 
变量 可 以 让 用 户 把 个 性 化 设置 传递 给 程序 ,这 些 变量 的 作用 有 点 象 全 局 变量 ,它们 可 以 被 所 
有 shell 的 池 进 程 存 取 。 本 章 的 后 面 将 深入 了 解 环境 ,现在 ,只 要 记 住 有 两 类 变量 就 可 以 了 ，。 


9.5.1 {FA shell 变量 
前 面 的 例子 演示 了 对 变量 的 大 部 分 操作 ， 对 变量 的 操作 如 下 。 











操作 类 型 语 法 注 释 

Re var= value 不 能 有 空格 

引用 Svat 

删除 unset var 

Sat A l read var 也 可 以 read var] var... 
列 出 变 其 set 

全 局 化 "export var 





变量 名 是 字符 A-—Z.a--£:.0—9 和 _ 的 组合。 第 一 个 字母 不 能 是 数字 。 变 量 名 是 大 小 写 
敏感 的 。 

变量 的 值 是 字符 弟 。 变 量 都 是 字符 品类 型 的 ,没有 数值 类 型 的 变量 。 所 有 的 操作 都 是 
TARRE. 

列 出 所 有 变量 使 用 set 命令 。set 命令 列 出 当前 shell 定义 的 所 有 变量 ,例如 ， 


5 set 

BASH = /bin/bash 

BASH VERSION = 1.14. 7(1) 
DISPLAY = :0.0 

FUID= 500 

HOME = /home2/bruce 
HOSTTYPE = i386 

IFS = 


LANG = en 

LANGUAGE = en 

LD_LIBRARY_PATH = /usr/lib:/usr/local/lib 
LOGNAME = bruce 

OPTERR = 1 

OPTIND = 1 

OSTYPE = Linux 

PATH = /bin;/usr/bin;/usr/XllR6/bin;:/usr/local/bin;/home2/bruce/bin 
PPID = 30928 ` 

PS4 = + 

PWD = /bome2 /bruce/projs/ubook/ src/ch09 
SHELL = /bin/bash 
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SHLVL = 2 

TERM = xterm- color 
UID = 500 

USER = bruce 

m fbin/vi 

age = 7 


name = fido 
这 个 列表 中 包括 很 多 在 登录 时 设置 的 变量 ,如 上 两 个 后 面 新 增 的 局 部 变量 。 
9.5.2 变量 的 存储 


要 在 shell 里 增加 变量 ,必须 有 个 地 方 能 存放 这 些 变量 的 名称 和 值 , 而 且 这 个 变量 存储 系 
统 必 须 能 够 分 辨 局 部 和 全 局 变量 。 下 面 是 这 个 存 情 系统 的 抽象 模型 ， 








(1) 模型 
变量 0d : 是 否 为 全 局 变量 ? 
data "Phonebook. dat” i n 
HOME "/home2/ f ido" Y 
TERM ^t1081" 了 


(2) 接口 (部 分 ) 

VLstoreCchar * var,char * val) 增 机 /更 新 var— val 

VLookup(char * var) 取得 var 的 值 

VList 输出 列表 到 stdout 

《3) 实现 

可 以 用 链表 ,hash 表 , 树 或 者 是 几乎 任何 数据 结构 来 实现 它 。 作 为 第 一 个 版 本 ,用 一 个 
结构 数组 ,其 中 的 每 个 变量 是 这 样 的 结构 ， 


struct vari 
char * str; /*name = val strings / 
int global; /*à booleans / 

ys 


static struct var Lab[ MAXVARS |; 






如 图 9.4 所 未 ， 
9.5.3 增加 变量 命令 : Built-ins 


已 经 有 地 方 存放 变量 了 ,但 还 要 增加 给 变 
量 峰值. 列 出 所 有 变量 和 获取 变量 值 的 命令 。 
这 就 是 说 ,在 这 个 shell 中 ,用 户 应 该 能 够 输入 ， 


9.4 shell 变量 的 存储 方式 


TERM = xtern 
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~ set 
lecho $ TERM 


set 是 shell 的 一 个 命令 ,而 不 是 一 个 由 shell 运行 的 程序 ,这 就 像 二 和 then 这 些 关 键 字 
Hi shell 自己 处 理 一 样 。 为 了 将 set 与 要 被 执行 的 程序 区 分 开 , 将 set 设置 为 内 置 Cbuilt 一 in) 
的 命令 。 

命令 varname=value 告诉 shell 在 变量 表 里 滩 加 一 项 ,赋值 诸 名 也 是 内 置 的 命令 。 

为 了 增加 内 置 的 命令 到 这 个 shell 中 ,需要 对 流程 图 做 另外 的 一 些 修改 。 在 调用 fork 和 
exec 之 前 必须 先 看 君 命令 是 省 是 shell ABA tS. SIA 9. 5 所 示 。 





simsh3 
ignore signals 
Fr 一 一 一 get command — —» exit 
: split line 
| : | 
|- 一 -一 — control command" 
| n 
| > built-in? 一 = 
| do built-in [ fork — 一 
J 1 
广 cum wait enable signals 
| | execvp 
| | 
Lee | exit 





E] 9.5 向 smsh rP S OY t er > 


修改 process 函数 ,使 之 在 调用 fork/exec Zt Bp ard ded 2g BHM: 


if ( args[0] == NULL) 
rv = 0; 
else if ( is control command(args[0]) ) 
rv = do control command(args); 
else if ( ck to execute(? )1 
if ( | builtin command(args,&rv) ) 
fv = execute(args); 


} 


新 的 函数 builtin_command 将 检验 利 执行 内 置 命令 合并 在 一 起 。 变 量 rv 用 来 标识 状 
态 + builtin_command 返回 一 个 布尔 值 ,并 修改 状态 变量 rv., 
builtin. c 的 代码 如 下 : 


/* builtin.c 
* contains the switch and the functions for builtin commands 


EFi 
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# include «Z stdio. ho 
if include string. h> 
# include <Cctype. h> 
# include "smsh. b" 


# include  "varlib.h" 


int assign(char +*+); 
int okname(char x* ); 


int builtin_command(char ** args, int x resultp) 
fs 
* purpose; run a builtin command 
* returns: 1 if args[0] is builtin, 0 if not 
a details; test args| 0] against all known built ~ ins. Call functions 
xf 


i 


int rv = 0; 


if ( stremp(args( 0], "set") == 0); /* 'set' command? «/ 
VLlist(); 


x resultp = 0; 


else if ( strehr(args[0], '=') (= NULL ){ /* assignment cmd «/ 
» resultp = assign(args|0 |); 
if € »resultp t= -1) /* x- y= 123 not ok x/ 


) 
else if ( stremp(args|0], "export") == 0 
if C args[1] {= NULL && okname(args[1]) ) 
# resultp = VLexport(args[1]); . 
else 
x resultp = 1; 
rv = 1; 
} 


return rv; 


} 


int assiqn(char * str) 

{x 

* purpose; execute name = val AND ensure that name is legal 
* returns; — I for illegal ival, or result of VLstore 

* warning; modifies the string, but retores it to normal 


i 
ey 


char * cp; 
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int Iv; 

cp = strchr(str,'='); 

x Cp = "AND; 

rv = ( okname(str) 7 Vistore(str,Cpt 1) : >= 1); 
vop = t= 1, 


return rv; 

} 
int okname(char * str) 
fe 

* purpose; determines if a string is a legal variable name 
* returns; 0 for no, 1 for yes 

xf 

{ 

char ¥* CB; 


for(cp = str; *c€p; cp== 91 

if ( (isdigit( « cp) && cp == str) || ! (isalnm( * cp) || *cep== ) 
return 0; 

} 


return ( cp ! = str );/# no empty strings, either «/ 


9.5.4 效果 如 何 


编译 并 运行 改进 后 的 程序 ， 


& co -o smsh3.c smsh2.c splitline.c execute. c process2.c \ 
controlflow.c builtin. c varlib.c 
$ ./smsh3 
> set 
“> day = monday 
>>temp = 75 
Tz = CST6CRT 
>x.yY=z 
cannol execute command:No such file or directory 
> set l 
day = monday 
temp = 75 
TZ = CST6CDT 
> date 
Tue Jul 31 11:56:59 EDT 2001 
> echo $ temp, $ day 
$ temp, $ day 
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(OD 已 经 可 以 正常 工作 了 

这 里 的 shell 现存 支持 变量 了 ,能 够 给 变量 赋值 ,也 可 以 列 出 当前 的 变量 , 程 说 甚至 会 检 
查 不 合法 的 变量 名 ,不 会 将 这 些 名 字 作 为 程序 名 来 处 理 。 

(2) TZ RAHA Date 

从 这 里 的 例子 看 出 还 有 两 件 事 要 做 。 先 将 变量 TZ 的 值 设 为 美国 中 部 时 间 (U. S. 
central time) ,但 是 date 命令 报告 的 还 是 美国 东部 时 间 。 前 面 说 过 ,变量 TZ RE ee 
境 的 一 部 分 , 它 的 值 应 该 从 父 进程 传 给 子 进程 ,这 如 何 首 能 实现 呢 ? 这 里 的 shell 如 何 才能 把 
变量 放 到 环境 中 使 它 的 子 进 程 能 够 访问 得 到 ? 所 以 , 接 下 来 将 讨论 环境 。 

(3) 变量 $ temp 和 $ day HERA HER RT 

刚才 的 测试 表明 这 两 个 变量 的 值 没有 被 shell 正确 显示 ,也 就 是 说 , 当 shell 在 处 理 echo 
$ temp. $ day 时 没有 用 变量 的 值 奉 换 变量 名 。 这 些 变 基 是 shell 的 局 部 变量 ,echo 命令 不 
知道 这 些 变 量 的 值 , 所 以 shell 在 执行 外 部 程序 之 前 必须 进行 变量 替换 。 本 章 的 末 屁 将 会 再 
探究 这 个 问题 。 


9.6 环境 :个 性 化 设置 


人 们 刘欢 按照 自己 的 喜好 设置 自己 的 电脑 ,有 些 人 喜欢 用 风景 画作 桌面 ,而 其 他 一 些 人 
可 能 更 喜欢 纯色 的 桌面 ,有 些 人 喜欢 用 emacs 来 编辑 文本 ,而 有 些 人 喜欢 vis Unix 允许 用 户 
在 称 之 为 环境 Cenvironmenty 的 地 方 以 变量 的 形式 存放 这 些 设置 ， 每 个 用 户 有 一 个 惟一 的 主 
目录 、 用 户 名 、 邮 件 文件 , 终 闻 类 型 和 喜欢 用 的 编辑 髓 ,很 多 个 性 化 的 设置 由 环境 中 的 变量 
记录 。 

很 多 程序 的 行为 基于 这 些 设置 ,比如 ,运行 script3, 可 以 看 到 date 根据 TZ 值 的 不 同 显 
不 不 同 的 格式 : 


#! /bin/sh 
4 script3 一 shows how an environment variable is passed to commands 
i TZ is time zone, affect things like date, and ls 一 了 
# 
echo "The time in BusLon is" 
TZ = ESTSEDT 
export TZ # add TZ to the environment 
date # date uses the value in TZ 
echo "The time in Chicago is" 
TZ = CST6CDT 
date 
echo "The time in LA is" 
TZ = PSTGPDT 
date 


环境 不 是 shell 的 一 部 分 。 但 是 shell 包括 一 些 可 以 让 用 户 读 取 和 和 修改 环境 的 命令 。 一 
如 既往 ERRE PIRE pe E ,然后 学 习 它 是 如 何 工 作 的 ,最 后 把 它 加 到 实现 的 代码 中 。 
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9.6.1 使 用 环境 


1. 列 出 环境 
env 命令 列 出 当前 所 有 环境 设置 


$ env 

LOGNAME - bruce 

LD_LIBRARY_PATH = /usr/lib;/usr/local/lib 

TERM - xterm - color 

HOSTTYPE - i386 

PATH = /bin;/usr/bin;/usr/XllR6/bin;/usr/local/bin:/home2/bruce/bin 
HOME = /home2 / bruce l 
SHELL = /bin/bash 

USER = bruce 

LANGUAGE = en 

DISPLAY = :0.0 

LANG = en 

NL /usr/ bin/env 


SHLVL = 2 


env 是 一 个 普通 的 程序 ,而 不 是 shell ABA GS. A EA h E BAR E E Y a G 
用 ,比如 ,LANG 变量 被 要 显示 信息 或 消息 的 程序 使 用 ,一 个 浏览 器 可 以 用 这 个 变量 的 值 来 
BR Fe FE A AY te A f 3 FAD xe IM, DISPLAY f Jg XWindows DASE EAT IE BE HT TERM 告诉 
curses(GUI 函数 库 )? 使 用 本 一 组 屏幕 控制 代码 ， 

2. 更 新 环境 

(1) var= value 

通过 对 变量 赋值 就 可 以 更 新 环境 设置 。 E 如 果 浏 览 器 支持 法 语 消息 和 菜单 ,可 以 通 
过 设置 LANG 一 fr 来 启用 法 语 。 

(2) export var 

EH shell 内 置 的 命令 export 向 环境 添加 新 的 变量 。 如果 var 是 一 个 局 部 变量 ,那么 它 
将 被 添加 到 环境 里 。 如 果 var 不 存在 ,shell 会 创建 一 个 。bash 允许 通过 用 export var = 
value 将 创建 和 输出 合并 为 一 步 。 

3. ACER PRA RR, 

使 用 标准 的 上 PERSE getenv 出 可 以 得 到 环境 变量 的 信和 ,比如 : 


# include < stdlib. h> 
main() 
t 
char *cp = getenv( "LANG"); 
if cp |= NULL && stremp(cp , "fr") == 0} 
printf ("Bonjour\n") ; 


else 
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printf("Hello\n"); 


9.6.2 什么 是 环境 以 及 它 是 如 何 工作 的 


环境 是 每 个 程序 都 可 以 存 取 的 一 个 字符 串 数 组 ,如 图 9.6 Bp. TRA PS HB 
以 var=value 这 样 的 形式 出 现 , 数 组 的 地 址 被 存放 在 一 个 名 为 environ 的 全 局 变量 里 。 环 境 
就 是 environ 指向 的 字符 串 数组 , 读 环 境 就 是 读 这 个 字符 串 数 组 ,改变 环境 就 是 改变 字符 串 、 
改变 这 个 数组 中 的 指针 或 者 将 这 个 全 局 指针 指向 其 他 数组 。 


environ 









TERM=v¥t100 


TZ-ESTSEDT 


PATH-/bin:/usr/bin 






HOMF--/users/bub 


E.S IREA E SR TS ET CH 


1. 一 个 简单 的 例子 
showenv. c 的 功能 就 像 命令 env: 


/* showenv.c - shows how to read and print the environment 


x/ 


extern char ` *# environ; /* points to the array of strings */° 


main() 
i 


int i; 


for(i- O0 s environ[i] t ise ) 
printf(" & sin", environ[i]); 


} 
changeenv. c 改变 环境 ,然后 运行 env: 


/* changeenv.c - shows how ta change the environment 
* note: calls "env" to display its new settings 
xf 

# include stdio. h > 


extern char ** environ; 
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main, ) 
{ 
char « table[3]; 


table[0) = “TERM = vt100"; /* £111 the table »/ 
table[1] = "HOME = /on/the/range"; 
teblef2] = 0; 
environ - table; /* point to that table »/ 
execlp("env", "env", NULL); /* exec a program «- 

} 

下 面 是 示例 ， 

5 ./changeenv 

TERM = vt100 

HOME = /on/the/range 


$ 


仔细 看 看 程序 。 fH changeenv ch fill g— ^ 5g REA . 8E PH execlp 来 运行 另 一 
个 程序 env。 第 二 个 程序 能 够 读 到 这 个 字符 串 列 表 , 也 就 是 说 通过 某 些 方法 ,将 这 个 数组 从 
第 一 个 程序 空间 复制 到 第 二 个 程序 空间 了 。 

2. 但 是 exec 清除 了 所 有 的 数据 1 

在 讨论 exec 系统 效用 时 候 知 道 ,对 它 的 泣 用 就 像 换 脑 , 川 目标 程序 的 代码 和 数据 蔡 换 涧 
用 程序 的 代码 和 数据 。 但 是 environ 指针 指向 的 数组 是 惟一 的 例外 : 当 内 核 执行 系统 调用 
execve 时 , 它 将 数组 和 字符 串 复制 到 新 的 程序 的 数据 空间 ,如 图 9. 7 所 示 . 


environ a 进程 






wait ( ) 










地 进程 了 父 进 程 有 | 
相同 的 代码 ,数据 | 


和 envisen . = 


exec BRA Brag (cag 
' 和 数据 到 进程 ， 


图 9.7 environ 指向 的 数据 在 执行 cxec() 时 试 复制 


在 生成 子 进程 的 过 程 中 ,观察 environ 数组 的 变化 。 可 以 看 到 ,fork 完整 地 复制 父 进程 ， 
包括 代码 和 数据 ,数据 中 包括 了 环境 。exec 清除 原来 进程 中 的 所 有 代码 和 数据 ,本 人 新 程序 
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的 代码 和 数据 。 只 有 通过 参数 execvp 传递 的 数据 和 存储 在 环境 中 的 字符 串 可 以 从 旧 程 序 复 
制 到 新 程序 。 

3. 子 进 程 不 能 修改 父 进 程 的 环境 

闻 程 序 中 环境 的 设 园 足 父 进程 环境 的 复 本 , 子 进 程 不 能 修改 父 进 程 的 环境 。 因 为 在 进 
程 调 用 fork 和 exec 时 整个 坏 境 都 被 自动 的 复制 了 ,所 以 通过 环境 来 传递 数据 比较 方 僻 、 
快捷 。 


9.6.3 在 smsh 中 增加 环境 处 理 


现在 可 以 修改 shell 程序 使 其 能 够 存 取 环境 变量 。 首先 ,shell 要 将 环境 中 的 变 景 添加 到 
自己 的 变量 列表 里 。 然 后 ,shell 的 几 户 要 能 够 修改 和 添加 环境 变量 。 

L ARHAR EE 

CHARM EJ ELEA — ARARA ERR RME. 4 shell 开始 运行 的 时 
个, 环境 中 的 变量 将 被 复制 到 自己 的 变量 列表 里 ,如 图 9.8 所 示 。 一 且 这 些 值 被 复制 到 变量 
列表 里 ,就 能 用 set 命令 和 赋值 命令 来 查看 利 修改 这 些 变量 了 。 


environ 









VLenviron2table 







从 环境 复制 字符 串 = i 
到 shell 的 变量 列表 
图 9.8 从 环境 复制 值 到 vartab 
2. 改变 环境 


对 smsh3 的 测试 显示 了 对 TZ 的 改动 并 没有 传 给 date, 现在 知道 如 何 修 改 环境 变量 了 。 
修改 环境 最 简单 的 方法 是 构建 一 个 全 新 的 列表 ,这 个 列表 包含 了 shell 中 的 所 有 变量 。 然 后 
将 全 局 指针 environ 指向 这 个 列表 ,如 图 9.9 所 示 。 调 用 exec, 内 核 将 这 些 设置 复 制 到 新 的 
程序 中 。 注 意 ,现在 没有 被 引用 的 坏 境 列表 中 依旧 存储 闭 原 来 的 值 。 

3. 对 smsh 44 4 Pk 

在 程序 流程 中 添加 两 步 , 如 图 9. 10 所 示 。 这 两 步 通 过 添加 两 行 代码 来 实现 。 
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environ 


TERN=xterm 


T2-PST8PDT 










TERM=vtL00 
TZ-ESTSEDT] 
PAITI-/bin: /usr Ain 











VLtable2environ 


将 标记 为 输出 的 
shell RS Fil 
到 新 建 的 字符 串 
数组 中 





9.9 SAM vartab 复制 到 新 的 环境 
(1) smsh4. c 中 的 setup 


void setup() 

ix i 
* purpose; initialize shell 
x returns: nothing. calls fatal() if trouble 
x/ 

i 


extern char * * environ; 


VLenviron2table(environ); 
signal(SIGINT, SIG IGN); 
signal(SIGQUIT, SIG IGN); 


(2) execute2. c 中 的 execute; 


if ( (pid = fork()) == -1) 

perror("fork"); 
else if ( pid == 0) 

environ = VLtable2environ();/* new line #/ 
Signal(SIGINT, SIG DF); 
signal(SIGQUIT, SIG bFL); 
execvp(argv[0], argv); 
perror( "cannot execute command"); 


exit(1); 


PATH= / bin: / sbin 
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smsh4 
igmore signals 
env2tab 
[^77 — -* get command — - exit 
| split line 
y | 
P -一 — control command? 
| p 
| 一 built-in? 一 -= 
| do built-in pe fork = 
| 二 — 4 wait tab2enw 
| enable signals 
| execvp 


| | | 
| | + 
| 


exit 





图 9.10 在 smsh 中 增加 环境 处 理 


4. 测试 改动 后 的 程序 


$ make snshd 


ec — o snshd smsh4.c splitline.c execute2.c process2.c \ 


controlflow.c builtin. c varlib.c 


5 ./smshá 
“>date 


Tue Jul 31 09:51:03 EDT 2001 


“> TZ = PSTSPDT 
“> export TZ 


[= date 


Tue Jul 31 06:51:30 PDT 2001 


> 


用 户 可 以 修改 和 增加 环境 变量 ,而 且 sheli 也 会 把 这 些 新 的 值 传 给 它 运 


9, 6.4 


/* varlib.c 


* 


varlib. c 的 代码 


+ a simple storage system to store name = value pairs 


* with facility to mark items as part of the environment 


* 


* interface: 


* 


VLstore( name, value ) returns 1 for Ok, 0 for no 


VLlookup( name ) returns string or NULL if not there 


prints out current tabie 


行 的 任何 程序 了 。 
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* environment - related functions 


* VLexport( name ) adds name to list of env vars 
* VLtabie2environ() copy from table to environ 

x VLenviron2table() copy from environ to table 

* 

x details: 


* the table is stored as an array of structs that 
* contain a flag for global and a single string of 
* the form name = value. This allows EZ addition to the 


x environment. It makes searching pretty easy, as 


* 


lonq as you search for "name - " 
* 


x/ 


# include  «stdio. h> 
# include <(stdlib. h> 
H include  "varlib.h" 


# include =< string. i> 
H define MAXVARS 200 /* a linked list would be nicer x/ 


struct var | 


char * str: /* name = val strings / 
int global; /* a booleans/ 
iz 
static struct var tab[ MAXVARS |; /* the tablex/ 


static char * new string( char x , char * );/* private methods», 


static struct var * find item(char * , int); 


F 


int VLstore( char * name, char * val) 
f/x 
* traverse list, if found, replace it, else add at end 
* since there is no delete, a blank one is a free one 
* return 1 if trouble, 0 if ok (like a command) 
x/ 
i 
struct var * itemp; 
char *&; 


int rv = 1; 


/* find spot to put it and make new string «/ 
if (Citemp- find item(name,1))! = NULL && 
(s= new string(name,val))| = NULL) 


if ( itemp- >>str ) /* has a val? «/ 
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free(itemp- —str); /* y; remove it «/ 
itemp str = s; 
/* okl «/ 


char * new string( char * name, char * val) 

fe 

* returns new string of form name = value or NULL on error 
x/ 

i 


char * retval; 


retval = malloc( strlen{name) + strlen(val) + 2); 
if ( retval ! = NULL } 
sprintt(retval, "%s= &s", name, val ); 


return retval,; 


char * VLiookup( char * name ) 

fx 
* returns value of var or empty string if nat there 
xf 

{ 


struct var * itemp; 


if ( Citemp = find item(name,0)) ! = NULL) 
return itemp- —str + 1 + strlen(name); 


return "". 


int VLexport( char * name ) 
í* 
* Marks a var for export, adds it if not there 


* returns 1 for no, 0 for ok 
x/ 


struct var x itemp; 


int rv = 1; 


’ 


if ( (itemp = find item(name,0)) | = NULL | 
itemp- —global = 1; 
rv = 0; 


1 
í 


else if ( VLstore(name, "") == 1) 


static struct var * find item( char * name 


一 一 
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x 


* 


rv = VLexport(name); 


return rv; 


, int first blank ) 
searches table for an item 
returns ptr to struct or NULL if not found 


OR if (first blank) then ptr to first blank one 


s/f 


int i; 
int len = strlen(name); 


char xs; 


r 


for( i = 0 ; i«zMAXVARS && tab[i]. str |= NULL ; i++ ) 
4 


s = tabli]. str; 
if ( strnemp(s,name,Jen) == 0 &&s[len] == +=" }{ 
return &tab| i|; 


} 

if ( i x MAXVARS && first blank ) 
return &tab|i :; 

return NULL, 


void VLlist() 
fe 


E 


* performs the shells set command 


* Lists the contents of the variable table, marking each 


* exported variable with the symbol '* ' 


x; 


int i; 
for(i = 0 ; i-;MAXVARS && tab[i]. str {= NULL; i++ ) 


! 
! 


if ( tab[i].global ) 
printf(" x 5$ sXn", tab[ i|. str); 
else 


printf(" % s\n", tabli]. str); 


int VLenviron2table(char x env[]) 


£f x 
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x initialize the variable table by loading array of strings 
x return ] for ok, 6 for not ok 
*/ 
t 
int i; 


char * Newstring; 


for(i = 0; env[i] != NULL; i== } 


i 
if ( i == MAXVARS ) 


return 0; 
newstring = mailoc(1+ strlen(env[i])); 
. if ( newstring == NULL ) 
return Q; 


strepy(newstring, envLij); 
tabl i]. str = newstring; 
tabli]. global = 1; 

} 


while( i < MAXVARS }{ /* I know we dort need this x/ 
tab[i) str = NULL; /* static globals are nulled «/ 
tabli==_.global = 0; /x by default af 

j 

return 1; 


char *«x VLtable2environ() 
/* 
* build an array of pointers suitable for making a new environment 


* note, you need to free() this when done to avoid memory leaks 


*/ 
{ 
int i, /* index */ 
j; /* another index */ 
n= Q; /* counter *f 
char * * envtab; /* array of pointers #/ 
Ix 


i 


* first, count the number of global variables 
x/ 


for(i = 0 ; i<cMAXVARS && tab| i]. str != NULL; it* ) 
if ( tab[i].global -- 1) 
ntt 


r 


/* then, allocate space for that many variables #/ 


envtab = (char **) malloc( (n1) + sizeof(char * 2); 
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if ( envtab == NULL) 
return NULL; 
/* then, load the array with pointers + 
for(i = 0, j = 0 ; i<CMAXVARS && tablij.str ! - NULL ; i++ ) 
if ( tab[ i]. global == 1) 
envtab| 3 ++ ] = tab[i;..str; 
envtabl 7] = NULL; 


return envtab; 


9.7 已 实现 的 shell 的 功能 


在 本 章 中 ,学 习 了 Unix shell 的 可 编程 特征 ,还 在 实现 的 shell 中 增加 了 3 个 重要 的 功 
能 :命令 行 解析 ,if. .then 语句 和 变量 ,使 这 个 小 小 的 shell 成 长 迅速 。 下 面 是 shell 目前 的 特 
征 列表 : 











特征 是 否 支 持 有 待 改 进 
”命令 运行 程序 

变量 一 :set read, Svar 替换 

if if. . then elsc 

environ 全 部 

exit exil 

ed cd 

Sewer] 不 支持 全 部 

(1) RRR 


增加 变量 替换 还 需 进 一 步 研究 。 在 流程 中 的 哪 一 步 将 $ X PRA X 的 值 ? 注意 下 面 的 
例子 : 


5 read x 

who am i 

$ $x 

mori.xyz.com! nobody ttyl Dec 31 13:56 
$ grep $x /etc/passwd 

grep: am: No such file or directory 

grep; i; No such file or directory 


3 


能 够 从 这 些 输 出 中 得 出 哪些 关于 shell 的 分 析 阶 段 和 变量 替换 阶段 之 间 关 系 的 信息 ? 这 
样 的 设计 有 什么 好 处 吗 ? 能 在 这 里 的 程序 中 烘 加 这 一 特性 吗 ? 
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shell 允许 用 户 将 进程 的 输入 和 输出 重 定向 到 文件 或 者 其 他 进程 。 这 是 如 何 做 到 的 观 ? 
能 够 在 这 里 的 shell 中 增加 这 一 特征 吗 ? 将 在 下 一 章 中 学 习 输 入 /输出 三 定向。 





小 结 

1, 主要 内 容 

* Unix shell 运行 一 种 称 为 脚本 的 程序 。 一 个 shell 脚本 可 以 运行 程序 ,接受 用 户 输 人 人 、 
使 用 变量 和 使 用 复杂 的 控制 逻辑 ， 

*。 if.. then BHF P RA, Unix 程序 返回 0 以 表示 成 功 。shell 使 用 wait 来 得 到 
程序 的 退出 状态 ， 

* shell 编程 语言 包括 变量 。 这 些 变 景 存储 字符 串 ,它们 可 以 在 任何 命令 中 使 用 。shell 
变量 是 脚本 的 局 部 变量 。 


每 个 程序 都 从 调用 它 的 进程 中 毕 承 一 个 字符 串 列 表 , 这 个 列表 被 称 为 环境 。 环 境 用 
来 保存 会 话 (session) 的 全 局 设置 和 某 个 程序 的 参数 设置 ,shell 允许 用 户 查 看 和 修改 
AH, 

2. 下 一 步 做 什么 

将 学 习 输 入 /输出 的 重 定向 。 

3. 习题 

9.1 编写 名 为 set 的 一 个 蕊 程序 或 脚本 , 坛 着 用 已 经 实现 的 shell 来 运行 它们 。 会 有 什 
AMR? 写 一 个 名 为 no 二 dice f) c 程序 或 者 脚本 然后 试 着 执行 它 ,又 会 如 何 ? 用 
同样 的 方法 试 试 名 为 test 的 程序 。 有 证 有 办 法 和 运行 这 些 程序 呢 ? 


9.2 能 修改 process. c 和 controlflow. cM HH MZ x ERE E HS if Hos? 这 就 是 说 ， 
ERED BELA KJE RAD S ALIS? 
if cmdl 
then 
if cmd2 
then 
cmd3 
else 
cmd4 
fi 
else 
cmds 
fi 
BUR CRI VL SAE BEER BE ,和 而 不 是 像 这 里 所 显示 的 1 层 。 需 要 更 多 的 状态 变量 吗 ? 
笑 要 一 个 本 来 保存 这 些 状 态 变 量 吗 ? 如 果 构 造 一 个 栈 , 用 递归 的 方法 来 解决 是 不 
是 合理 ? 
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9.3 


varlib. c 中 的 函数 通过 创建 一 个 新 的 环境 数组 来 更 新 环境 。 为 什么 不 用 realloc 来 
调整 原来 环境 的 大 小 呢 ? 


4， 编 程 练 习 


9. 4 


修改 smshl.ec 使 之 能 够 在 一 行 中 接受 多 个 命令 。 要 做 到 这 一 点 最 简单 的 方法 是 
修改 next cmd 盟 数 ,注意 不 要 打印 洛 余 的 提示 符 。 


修改 smshl.c 使 之 能 够 接受 带 可 选 参 数 的 exit aS. TRL AY TR FF dB H8 3E BO 
的 参数 (比如 :exit left) 。 原 来 的 流程 中 在 哪里 处 理 这 个 命令 ? 需要 增加 新 的 节点 
到 原来 的 流程 中 去 吗 ? 


修改 process. c 使 之 能 支持 这 控 制 语句 中 的 else 部 分 。 


Ok to execute 范 数 使 用 两 个 变量 米 记录 当前 的 区 域 和 状态 。 可 以 用 一 个 有 多 个 
值 的 变量 来 替代 原来 的 两 个 变 最 。 潜 点 下 面 一 组 状态 : 
NEUTRAL, IF SUCCEEDED, IF FAILED, SKIPPING THEN, DOING THEN, SKIPPING ELSE, DOING 
_ELSE 


修改 controlflow. c 以 使 用 这 个 单 变量 的 系统 。 


修改 smshl.c 使 之 能 接受 & 命令 结束 符 。 以 这 个 符号 结束 的 命令 将 在 后 台 运 行 。 
需要 对 next_cmd 做 一 些 修改 。 


常规 的 shell 直到 读 到 最 后 HOGER fi AE final 的 缩 邱 ,出 是 肥 过 来 的 iD) 才 执行 整 
个 语句 据 。 另 一 个 完全 不 同 的 做 法 是 将 让 结构 中 的 所 有 语句 读 和 人 - -个 有 三 个 部 
分 的 结构 体 中 。 第 一 个 部 分 是 条 件 命令 ,第 二 个 部 分 是 then 区 域 , 最 后 是 else 区 
域 的 命令 。 

将 整个 块 读 入 内 存 后 ,就 能 开始 执行 条 件 命令 ,基于 它们 的 结果 ,执行 then 区 域 或 者 
else 区 域 ， 写 一 个 采用 这 个 方案 的 smsh。 你 的 解 应 该 能 接受 向 全 的 这 请 人 名。 


在 你 的 shell 中 添加 while 循 坏 ， 为 了 增加 这 个 功能 ,需要 把 循 坏 体 读 人 内 存 , 小 
A Fit S (memory leak), 


一 个 进程 有 很 多 属性 , 共 中 之 一 是 这 个 进程 的 当前 日 录 。Unix 的 发 明 者 写 了 个 
程序 hdir, 还 有 共 他 -- 些 标准 的 目录 程序 :pwd,ls,mes 等 。 这 些 程序 已 经 被 废 
弃 , 它 们 的 功能 直接 由 shell 来 实现 。chdir 应 用 程序 有 和 什么 问题 如? 在 你 的 
shell 中 添加 ed 命令 。 


shell 支持 特殊 的 变量 来 表示 系统 设置 。 比 如 ,变量 $$ 表示 shell (B ERE ID, ilii 
s? 表示 最 后 一 条 命令 的 退出 状态 值 。 在 你 的 程序 中 堵 加 这 些 变量 。 


在 标准 Unix shell 的 命令 行 中 ,可 以 将 引号 引起 来 的 部 分 作为 一 个 独立 的 参数 ， 
一 个 命令 像 vi "My Book Report" 包 含 两 个 命令 行 参数 。 使 你 的 shell 接受 引号 。 
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在 shell 的 鄂 一 部 分 处 理 引 号 ? 考 虚 命令 rm "filel. c;2”"。 就 算 你 的 程序 将 分 号 
理解 为 命令 分 隔 符 ,这 个 表达 式 还 是 应 该 被 理解 为 一 条 有 两 个 参数 的 命令 。 


很 多 shell 允许 用 户 通 过 对 一 个 特定 的 变量 赋值 来 设置 命令 提示 符 , 在 你 的 shell 
中 增加 这 个 特征 。 在 自己 的 shell 中 定义 一 个 变量 来 表示 提示 符 。sh 和 bash 用 
变量 PS1, csh 家 族 用 变量 prompt, 
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概念 与 技巧 

‘YORE: 概念 与 原因 

* 标准 输入 .输出 和 标准 错误 的 定义 
。 重 定向 标准 L/D 到 文件 

© 使 用 fork 来 为 其 他 程序 重 定 向 

。 管道 (Pipe) 

* 创建 管道 后 调用 fork 

TH 3x BAT 36 2e IU FH] s 

* dup.dup2 

* pipe 


10.1 shell 编程 


下 面 这 组 命令 是 如 何 工作 的 ? 


ls — my. files 
who | sort>>userlist 


shell J& n fef 2; ih #8 Fe ae S8 RA HB. S Sc FIR EE? shell 又 是 如 和 何 将 一 个 进程 
的 输出 流连 接 到 另 一 个 进程 的 输入 流 的 呢 ? 标准 输入 (standard input) 这 个 本 语 是 什么 
意思 ? 

本 章 将 关注 进程 间 通 信和 的 一 种 特殊 形式 : 输入 /输出 重 定向 和 种 管道 (1/O redirection and 
pipes)。 首 先 将 介绍 在 编写 shell 脚本 时 1/O 重 定 向 和 管道 所 起 的 作用 。 然 后 ,本 章 和 将 介绍 
操作 系统 中 对 1/O 重 定向 的 支持 。 最 后 , 写 一 个 程序 来 改变 进程 的 输入 和 输出 流 。 
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10.2. 一 个 shell 应 用 程序 : 监视 系统 用 户 


考虑 一 下 这 个 问题 : 你 的 许多 朋友 和 你 使 用 同一 个 Unix 系统 。 你 希望 编写 一 个 程序 ， 
当 其 他 用 户 登 录 系 统 或 和 注销 时 通知 你 。 这样 你 就 可 以 了 解 朋友 们 的 活动 。 

可 以 写 一 个 使 用 ump 文件 和 间隔 计数 器 的 C 程序 来 完成 任务 。 程 序 打 开 utmp 文件 ， 
记录 下 用 户 列表 ,休眠 一 段 时 间 后 再 重新 扫描 此 文件 ,并 将 变化 报告 出 来 。 

一 个 更 简单 的 办 法 就 是 写 一 个 shell MA, Unix 中 有 一 个 列 出 当前 用 户 的 命令 : who, 
Unix 中 同样 包含 了 休眠 和 处 理 字符 串 列 表 的 程序 。 下 面 是 一 个 Unix 的 脚本 .用 来 报告 所 有 
的 登录 和 注销 情况 。 


Logic shell code 
get list of users(ca:i in prev) who | sort > prev 
while true while true ; do 
sleep sleep 60 
get list of uzers(ceJ: if curr) who | sort > curr 
compare lists echo "logged out, " 
in prev, not in curr -> logout comm — 23 prev curr 


echo "logged in, " 


in curr, not in prev ~> login comm - 13 prev curr 
make prev = curr mv curr prev 
repeat done 


ERANT Unix 系统 所 提供 的 7 个 工具 、 一 个 while 循环 和 LO 重 定 向 ,编写 这 个 程 
序 解决 了 问题 。 仔细 看 一 下 这 些 程 序 的 细节 ,以 及 它们 之 间 的 连接 。 

脚本 中 的 第 一 行 建立 了 一 个 在 此 脚本 运行 时 已 登录 用 户 的 列表 ,并 接 用 户 名 进行 排序 。 
who 命令 输出 用 户 列表 ,而 son 命令 将 列表 作为 输入 读 进 ,然后 输出 一 个 排 好 序 的 列表 

命令 who | sort > prev 告诉 shell 同时 执行 who 和 sort. who 的 输出 直接 送 到 sort 
的 输入 ,如 图 10. 1 所 示 。who 命令 并 不 一 定 要 在 sort 命令 开始 读 取 和 排序 之 前 完成 对 
ump 文件 的 分 析 。 这 两 个 进程 以 很 小 的 时 间 间 隔 为 单位 来 调度 ,它们 和 系统 中 的 其 他 进程 
一 起 分 享 CPU 时 间 、 然 后 ,sort > prev 告诉 shell 将 sort 的 输出 送 至 prev 文件 中 。 若 此 文 
件 不 存在 ,; 则 创建 此 文件 ; 车 已 经 存在 , 则 替换 其 内 容 。 





Ep 10.1. 将 who 的 输出 连结 到 sort 的 狂人 
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在 休眠 一 分 钟 之 后 ,脚本 在 文件 curr 中 创建 了 一 个 新 的 用 户 列 表 。 如 何 来 比较 两 个 排 
好 序 的 登录 记录 列表 呢 ? 使 用 Unix 的 工具 comm( 如 图 10. 2 所 示 ) ,可 以 找 出 两 个 文件 中 共 
有 的 行 。 比 较 两 个 文件 可 以 得 到 三 个 子 集 ; 仅 文件 1 有 的 行 , 仅 文 件 2 有 的 行 ,两 者 共有 的 
fi. comm 命令 比较 了 两 个 排 过 译 的 列表 ,并 将 此 三 列 打印 出 来 ,这 里 的 每 一 列 代表 一 个 子 
集 的 内 容 。 可 以 使 用 命令 行 选项 来 让 结果 只 出 现 其 中 的 任意 一 列 或 两 列 。 比 如 说 ,如 下 两 
个 命令 : 





comm — 23 prev curr 4 MER JAZA MER prev 中 的 内 容 
comm - 13 prev curr 斗 删 除 第 一 列 和 第 三 列 — Ra curr 中 的 内 容 


生成 所 需要 的 两 个 集合 : 前 一 个 列表 中 有 而 当前 列表 中 没有 的 登录 记录 (注销 的 用 户 ), 以 及 
当前 列表 中 有 而 前 一 个 列表 中 没有 的 登录 记录 (新 登录 用 户 ) 。 


图 10.2 comm 比较 两 个 列表 ,输出 三 个 集合 


最 后 ,命令 mv curr prev 将 当前 列表 文件 curr 更 名 为 prev, 并 替换 原来 的 prev 文件 。 

watch. sh 脚本 体现 了 三 个 重要 的 思路 : 

(1) shell 脚本 的 功能 一 一 与 心 相 比 简单 易 用 ，; 

(2) 软件 工具 的 灵活 性 一 一 每 一 个 工具 完成 一 项 特定 的 、 通 用 的 功能 ; 

(3) L/O 重 定向 和 管道 的 使 用 和 作用 。 

程序 watch. sh 展示 了 如 何 使 用 “ 守 >” 操作 符 来 把 文件 着 成 任意 大 小 和 结 椅 的 变量 。 类 似 
于 某 人 用 已 守 了 如 下 的 调用 ， 


x = func a(func b(y)); /将 fune b 的 结果 作为 func_a 的 输入 */ 
用 shell 写 , 就 是 : | 

prog b | prog a > x# 将 progb 的 结果 作为 prog_a 的 输入 并 将 最 终结 果 放 人 x 

这 些 程序 如 何 工作 的 ? shell 在 进程 的 连接 中 起 什么 样 的 作用 呢 ? 内 核 起 什么 作用 ? 音 
个 程序 又 起 什么 作用 ? 


10.3 标准 1/0 与 重 定 向 的 若干 概念 


所 有 的 Unix VO 重 定向 部 基 于 标准 数据 流 的 原理 。 考 谍 一 下 sort 工具 是 如 何 工 作 的 。 
sort 从 一 个 数据 流 中 读 取 字 节 ,再 将 结果 输出 到 另 一 个 流 中 ,同时 车 有 错误 发 生 , 则 将 错误 报 
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告 给 第 三 个 流 。 如 果 和 忽略 这 些 标准 流 的 去 向 问题 .sort 工具 的 基本 原型 就 如 图 10, 3 所 示 。 
三 个 数据 流 分 别 如 下 : 

， 标准 输入 一 一 需要 处 理 的 数据 流 

。 标准 输出 一 一 结果 数据 流 

。 标准 错误 输出 一 一 错误 消息 流 





finn di HR 
图 10.3 sort LAA E ZEE SR LAUR TORRE IL D 


10.3.1 UE 1: 3 个 标准 文件 描述 符 


所 有 的 Unix 工具 都 使 用 图 10, 3 中 所 示 的 云 种 流 的 模型 。 此 模型 通过 一 个 简单 的 规则 
来 实现 。 这 三 种 流 的 每 一 种 都 是 一 个 特别 的 文件 描述 符 , 其 细节 如 图 10. 4 所 不 。 








标准 文件 描述 行 
0: stdin 

1: stdout 

2; stderr 








图 10.4 3 个 特殊 的 文件 描述 符 


概念 : 所 有 的 Unix 工具 都 使 用 文件 描述 符 0、1 和 2, 
标准 输入 文件 的 描述 符 是 0, 标准 输出 的 文件 描述 符 是 1 ,而 标准 错误 输出 的 文件 描述 符 
则 是 2。Unix 假设 文件 描述 符 0、1.2 已 经 被 打开 ,可 以 分 别 进 行 读 . 写 和 写 的 操作 了 . 


10.3.2 默认 的 连接 : tty 


通常 通过 shell 命令 行 运行 Unix 系统 工具 时 ,stdin,stdout 和 stderr 连接 在 终端 上 。 因 
此 ,工具 从 键盘 读 取 数据 并 且 把 输出 和 错误 消息 写 到 屏幕 .举例 来 说 ,如 果 输 人 sort 并 按 下 
HER ASR ERD sort 工具 上 。 随 便 输 入 几 行 文字 , 当 按 Cul - D 键 来 结束 文字 答 
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A BIRTIR sort 程序 对 输入 进行 排序 并 将 结果 写 到 stdout, 
大 部 分 的 Unix 工具 处 理 从 文件 战 标准 输入 读 信 的 数据 。 如 果 在 命令 行 上 给 出 了 文件 
名 ,工具 将 从 文件 读 取 数据 。 若 无 文件 名 ,程序 则 从 标准 输入 读 取 数据 ， 


10.3.3 程序 都 输出 到 stdout 


从 男 一 方面 说 ,大 多 数 程序 并 不 接收 输出 文件 各 ; 它们 总 是 将 结果 写 到 文件 描述 符 1, 并 
将 错误 消息 写 到 文件 描述 符 2?。 如 果 和 希望 将 进程 的 输出 写 到 文件 或 另 一 个 进程 的 输入 去 ， 
就 必须 重 定 人 向 相应 的 文件 描述 符 。 


10.3.4 BE I/O 的 是 shell 而 不 是 程序 


通过 使 用 输出 重 定 向 标志 ,命令 cmd filename 告诉 shell 将 文件 描述 符 1 定位 到 文件 。 


于 是 shell 就 将 文件 描述 符 与 指定 的 文件 连接 起 来 。 
程序 则 持续 不 断 地 将 数据 写 到 文件 描述 符 1 中 ,根本 没有 意识 到 数据 的 有 目的 地 已 经 改变 
T . FI EIE lstargs. c 展示 了 程序 甚至 没有 看 到 命令 行 中 的 重 定 向 符号 : 


/* listargs.c 


* print the number of command line args, list the args, 
* then print a message to stderr 
«/ 


# include «stdio. h> 
main( int ac, char « av{]) 


{ 


int i; 


printf("Number of args: $d, Args are. Mn", ac); 
forli = 0; i«cac; itt) 


printf("args[ $d} &sXn", i, av[ ip; 


fprintf(stderr, "This message is sent to stderr. Xn"); 


) 


程序 listargs 将 命令 行 参数 打印 到 标准 输出 。 注意 listargs 并 没有 打印 出 重 定向 符号 和 
文件 各。 


5 cc listargs.c - o listargs 

S ./listargs testing one two 
args[0] . /listargs 

args[1] testing 

args[2] one 

args| 3] two 

This message is sent to stderr. 





D sort dd wr Sei RES stdout ,但 这 是 由 于 其 他 的 原因 。 
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$ ./listargs testing one two > xyz 
This message is sent to stder. 

$ cat xyz 

args[0] ./listargs 

args[1] testing 

args[2] one 

args] 3] two 

s ./listargs testing -zyz one two 27— oops 
5 cot xyz 

args[ 0] . /listargs 

args[ 1] testing 

args[ 2) one 

args[3] two 

5 cat oops 


This message is sent to stderr. 


这 些 例 子 验 证 了 关于 shell 输出 重 定向 的 一些 重要 概念 。 最 重要 的 一 点 是 shel 并 不 将 
重 定向 标记 和 文件 名 传递 给 程序 。 

第 二 个 概念 是 重 定向 可 以 出 现在 命令 行 中 的 任何 地 方 ,并 且 在 重 定向 标识 符 周 围 并 不 
需要 空格 来 区 分 。 甚 至 一 个 像 > listing ls 这 样 的 命令 也 是 可 以 接受 的 。 这 样 , >” 符号 并 
不 能 终 正 命令 和 参数 , 它 只 不 过 是 一 个 附加 的 请 求 而 已 。 

最 后 一 个 概念 是 许多 版 本 的 shell 都 提供 对 重 定向 其 他 文件 描述 符 的 支持 。 例 如， 
2> filename 即 重 定向 文件 描述 符 2 ,也 就 是 将 标准 氏 误 输出 到 给 定 的 文件 中 。 


10.3.5 理解 /QO 重 定向 


在 watch. sh 中 可 以 看 到 , VO 重 定 向 是 Unix 程序 设计 中 一 个 重要 部 分 。 同样 在 
listargs. c 中 看 到 ,是 shell, 而 非 程序 将 输入 和 输出 重 定向 的 。 

但 shell 是 如 何 重 定向 L/O 的 呢 ? 怎样 写 重 定向 L/O 的 程序 呢 ? 本 章 的 工作 就 是 编写 
可 以 完成 三 个 基本 的 重 定 问 操 作 的 程序 








» who>userlist 将 stdout 连接 到 一 个 文件 
* sort- data 将 stdin 连接 到 一 个 文件 
* who|sort 将 stdout 连接 到 stdin 


10.3.6 概念 2: "ELK RI AF ( Lowest — Available — fd) " FM 


那么 什么 是 文件 宰 述 符 呢 ? 文件 措 述 符 的 概念 非常 简单 : 它 是 一 个 数组 的 索引 号 。 每 
个 进程 都 有 其 打开 的 一 组 文件 。 这 些 打开 的 文件 被 保持 在 一 个 数组 中 。 文 件 撕 述 符 吕 为 某 
文件 在 此 数组 中 的 索引 。 图 10.5 fon T "i B AT FH CAE E XR ff Lowest- Available- fd)” 
原则 。 
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Unix 经 常 给 最 低 可 用 文件 撒 述 符 指 定 新 连接 








图 10.5 最 低 可 用 文件 描述 符 原则 


BER. 当 打 开 文件 时 ,为 此 文件 安排 的 描述 符 总 是 此 数组 中 最 低 可 用 位 置 的 索引 。 

通过 文件 描述 符 建 立 一 个 新 的 连接 就 像 在 一 条 多 路 电话 上 接收 一 个 连接 一 样 。 每 当 有 
用 户 乒 一 个 电话 号 码 , 内 部 电话 系统 为 这 不 按 号 请 求 分 配 一 条 内 部 的 线路 号 。 在 许多 这 样 
的 系统 上 ,下 一 个 打 进来 的 电话 就 被 分 配给 最 小 可 用 的 线路 号 。 


10.3.7 两 个 概念 的 结合 


. 已 经 介绍 了 两 个 基本 的 概念 。 首 先 ,Unix JE RFE 0、1 .2 作为 标准 钉 入 、 答 

出 和 钳 误 的 通道 。 其 次 , 当 进 程 请 求 一 个 新 的 文件 描述 符 的 上 时候, 系统 内 上 核 将 最 低 可 用 的 文 
件 描 述 符 络 给 它 。 将 这 两 个 概念 结合 在 一 起 :大 家 就 可 以 理解 ]/O 重 定向 是 如 何 工作 的 了 ， 
也 就 可 以 自己 写 出 程序 来 完成 /O 的 重 定向 。 


10.4 如何 将 stdin 定向 到 文件 


下 面 将 详细 地 考察 ,程序 如 何 将 标准 输入 重 定 向 以 至 可 以 从 文件 中 读 取 数据 。 更 加 精 
确 一 点 说 ,进程 并 不 是 从 文件 读数 据 , 而 是 从 文件 描述 符 读数 据 。 如 果 将 文件 描述 符 0 定位 
到 一 个 文件 ,那么 此 文件 就 成 为 标准 输入 的 源 。 

下 面 将 考察 三 种 将 标准 输入 定位 到 文件 的 方法 。 其 中 有 些 方 法 并 不 适合 于 文件 ,但 使 
用 管道 的 时 候 , 这 些 方法 都 是 必要 的 。 





10. 4.1 方法 1: close then open 


第 一 种 方法 是 close-then-open 策略 。 这 种 技术 类 似 于 挂 断 电话 释放 一 条 线路 ,然后 
再 将 电话 捡 起 从 而 得 到 另 一 条 线路 。 具 体 步 又 如 下 。 

开始 的 时 候 . 系 统 中 采用 的 是 上 典型 的 设置 。 即 三 种 标准 流 是 被 连接 到 终端 设备 上 的 。 
输入 的 数据 流 经 过 文件 描述 符 0 而 输出 的 流 经 过 文件 描述 符 1 和 和 2, 如 见 图 10. 6 所 示 ， 

接 下 来 .第 一 步 是 elose(0), 即 将 标准 和 输 和 人 的 连接 挂 断 。 这 里 调用 close(0) 将 标准 输入 
与 终端 设备 的 连接 切断 。 图 10. 7 中 显示 了 当前 文件 描述 符 数 组 中 的 第 一 个 元 素 现 在 处 在 空 
AKA. 





» 306 - ‘Unix/Linux E 3c RE SCR 











Marx tt 
10.6 典型 的 初始 化 配置 


调用 close (0) 之 后 











10,7 stdin EXA 


最 后 ,使 用 open(filename,O_RDONLY) H A — ^- S xk HE 8] stdin 上 的 文件 。 当 前 的 最 
低 可 用 文件 描述 符 是 0, 因 此 所 打开 的 文件 将 被 连接 到 标准 输入 上 去 。 如 图 10. 8 所 示 ,任何 
从 标准 输 和 人 读 取 数据 的 函数 都 将 从 此 文件 中 读 人 。 





| ARI open ( ) 之 后 
| 


| 二 
| 文件 的 连接 ， 并 建立 指 应 
rinccmmm| 最 低 可 能 表 项 的 指针 ， 





指向 连接 


图 10.8 stdin 现在 已 经 连接 到 文件 上 了 
下 面 的 程序 即使 用 close - then - open 方法 : 


»/ stdinredirl.c 

* purpose, show how to redirect standard input by replacing File 
x descriptor 0 with a connection to a file. 

a action; reads three lines From standard input, then 


* closes fd 0, opens a disk file, then reads in 
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* three more lines from standard input 
xf 
# include <Cstdio. h> 


# include «< fentl. h> 


maint) 
{ 

int fd ; 

char linef 100]; 


/* read and print three lines «/ 


fgets( line, 100, stdin); printf(" % s", line); 
fgets( line, 100, stdin }; printf(" €5", line); 
fgets( line, 100, stdin); printf("5*s", line}; 


/* redirect input */ 


close(0); 

fd = open("/etc/passwd", O HDONLY); 

if (fd |» 03 
fprintf(stderr, "Could not open data as fd 0\n"); 
exit(i); 

? 


/* read and print three lines «/ 


fgets( line, 100, stdin ); printf(" *& 5", line); 
fgets( line, 100, stdin ); printf(" $ s", line); 
fgets( line, 100, stdin ); printf("$ s", line); 


程序 stdinreader] 从 标准 输 人 读 取 并 打印 了 三 行 字符 串 , 然 后 重 定向 标准 输 和 人 ,之 后 又 
从 标准 输入 中 读 取 并 打印 了 三 行 字 符 串 。stdinreaderl 从 键盘 读 取 了 前 三 行 字符 串 , 而 后 三 
ITF REMA passwd 文件 中 读 出 的 : 


$ ./stdinredirl 

linel 

linel 

testing line2 

testing line2 

line 3 here 

line 3 here 

root, x; 0, 0; root, /root, /bin/bash 
bin; x; 1; 1, bin, /bin,; 

daemon, x; 2; 2; daemon, /sbin: 


$ 
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此 程序 并 没有 什么 特别 的 地 方 . 它 仅 仅 挂 断 电 话 又 拨 了 一 个 新 的 号 码 而 已 。 当 连接 建 
立 起 来 后 ,就 可 以 从 标准 输 人 的 一 个 新 的 源 接收 数据 了 。 


10.4.2 方法 2:， open.. close. .dup. .close 


yE PRA: 电话 响 了 ,你 全 起 了 楼 上 的 分 机 ,但 你 意识 到 自己 应 该 下 楼 去 接 电 
话 。 于 是 你 让 楼 下 的 人 把 电话 推 起 ,这 样 就 有 两 个 连接 ,然后 把 杰 上 的 分 机 挂 断 .此 叶 楼 下 
的 电话 是 惟一 的 连接 了 。 这 种 情况 大 家 是 不 是 很 熟悉 ? 其 实 这 种 方法 的 思路 就 是 从 楼 上 的 
电话 复制 一 个 连接 到 楼 下 ,然后 就 可 以 在 不 断 线 的 情况 下 将 楼 上 的 连接 切断 。 
如 图 10.9 Bras Unix 系统 调用 dup 建立 指向 已 经 存在 的 文件 描述 符 的 第 二 个 连 撑 .这 
种 方法 需要 THR. 
(1) open( file) 
第 一 步 是 打开 stdin 将 要 重 定向 的 文件 。 这 个 调用 返回 一 个 文件 描述 符 , 这 个 描述 符 并 
不 是 0, 因 为 0 在 当前 已 经 被 打开 了 。 
(2) cluse(0) 
下 一 步 是 将 文件 描述 符 0 关闭 。 文件 描述 符 0 MEE ASAT. 
(3) dup(fd) 
系统 调用 dup《1d) 将 文件 描述 符 fd 做 了 一 个 复制 。 此 次 复制 使 用 最 低 可 用 文件 描述 符 
。 因 此 , 效 得 的 文件 描述 符 是 0。 这 样 , 就 将 磁盘 文件 与 文件 描述 符 0 连接 在 一 起 了 . 
(4) close([d) 
最 后 ,使 用 closeCE d 3E E B] xc dp 89 Js Oa RP EIR TF 0 的 连接 。 将 这 种 方法 
与 把 电话 从 一 个 分 机 转移 到 另 一 个 分 机 的 技术 做 一 个 比较 。 


a 


fd = open("f", O RDONLY); close[0): 








9810.9 使 用 dup 重 定向 
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下 面 的 程序 stdinredir2. c 使 用 了 第 二 种 方法 ， 


/* stdinredir2.c 
* shows two more methods for redirecting standard input 
x use # define to set one or the other 
x/ 

# include | «stdio.h-— 


H include — «fcntl.h- 


/* xi define | CLOSE DUP /* open, close, dup, close */ 


/* #define USE DUP2 /* open, dup2, close «/ 
main() 
1 

int fd > 

int newfd ; 


char linef 100]; 
/* read and print three lines */ 


fgets( line, 100, stdin ); printf("$ s", line); 
fgets( line, 100, stdin); printf(" $ s", line}; 
fgets( line, 100, stdin ); printf(" * s", line 5; 


/* redirect input */ 


fd - open("data", O RDONLY); /* open the disk file «/ 
# ifdef CLOSE DUP 
close(0); 


newfd = dup(íd5; /* copy open fd to 0 x/ 
Helse í 

newfd = dup2(fd,0); /* close 0, dup fd to 0 «/ 
f endif 


if ( newfd !- 0) 
fprintf(stderr, "Could not duplicate fd to 0\n"); 
exit(1); i 

1 

[i 

close(fd) ， /* close original fd x/ 


/* read and print three lines «/ 


fgets( line, 100, stdin ); printf("& s", line); 

fgets( line, 100, stdin ); printf(" S s", line 5; 

fgets( line, 100, stdin ); printf(" $& s", line); 
: 


介绍 上 面 提 到 的 这 个 包含 有 4 个 步骤 的 方法 的 主要 目的 是 为 了 让 大 家 了 解 dup 系统 调 
用 ,这 个 调用 在 后 面 学习 管 道 的 时 候 是 非常 重要 的 。 一 个 简单 一 点 的 方案 是 将 elose(07 和 
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dup(Cfd) 结 合 在 一 起 作为 一 个 单独 的 系统 调用 dup2。 
10.4.3 系统 调用 dup 小 结 














dup. dupz 

目标 复制 个 文件 描述 答 
头 文件 dtinclude << unistd, h> 
函数 原型 newfd = dupColdfd) ; 

newfd = dup2(Coldf[d,newld); 
参数 oldíd 需要 复制 的 文件 描述 符 

newf 复制 oldfd 后 得 到 的 文件 描述 符 

返回 值 一 并 发 生 错 误 

newfd 新 的 文件 描述 符 


系统 调用 dup 复制 了 文件 描述 符 oldfd。 而 dup2 将 oldfd 文件 描述 符 复制 给 newid. WS 
个 文件 描述 符 都 指向 同一 个 打开 的 文件 。 这 两 个 调用 都 返回 新 的 文件 措 述 符 , 车 发 生 错 误 ， 
则 返回 一 1。 


10.4.4 方法 3: open. . dup2. . close 


程序 stdinredir?. c 包含 了 条 件 编 译 代 码 并 ifdef ,用 系统 调用 dup2(fd,9) 来 替换 close(0} 
和 dup(fd). dup2(orig, new) E OC EET ETE old 复制 到 文件 措 述 符 new, EIS BU Zo C 
件 描述 符 new 上 已 经 存在 的 连接 关闭 。 


10.4.5 shell 为 其 他 程序 重 定向 stdin 


这 些 例 子 显示 了 程序 如 何 将 标准 输入 重 定向 到 文件 。 实 际 上 ,如 果 程 序 希 望 读 取 文件 ， 
它 直接 和 打开 文件 就 可 以 了 ,根本 不 需要 将 标准 输 人 重 定向 到 文件 。 这 些 例子 的 真正 意义 在 
于 说 明 一 个 程序 如 何 将 标准 输 人 重 定向 到 别 的 程序 。 


10.5 ”为 其 他 程序 重 定向 I/O: who > userlist 


当 某 用 户 输 入 who>userlist,shell 运行 who 程序 ,并 将 who 的 标准 输出 重 定 向 到 名 为 
userlist 的 文件 上 。 这 是 如 何 完成 的 呢 ? 

关键 之 处 就 在 于 fork 和 exec 之 闻 的 时 间 间 阶 。 在 fork 执行 之 后 , 子 进程 仍然 在 运行 
shell 程序 ,并 准备 执行 exec。exec 将 蔡 换 进程 中 运行 的 程序 ,但 它 不 会 改变 进程 的 属性 和 进 
程 中 所 有 的 连接 。 也 就 是 说 ,在 运行 过 exec 之 后 ,进程 的 用 户 ID 不 会 改变 ,其 优先 级 不 会 政 
变 , 并 且 其 文件 描述 符 也 和 运行 exec 之 前 一 样 。 注意 ,程序 得 到 的 是 载 入 它 的 进程 所 打开 的 
文件 。 图 10. 10 展示 了 于 进程 的 输出 重 定向 。 
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PRHE T LA EHR tT | 
文件 的 指针 。 子 进程 项 定向 标 
准 输出 ， 


close(1)1 





ereare( “f") 








exect) i 
TIE SET EAR AR XC PE 
彼 子 进程 打开 文件 





图 10. 10 shell 为 子 进程 重 定向 其 输出 


看 一 下 如 何 使 用 这 个 原则 来 重 定向 标准 鞭 出 。 

l. 初始 情况 

如 图 10.11 所 示 ,进程 运行 在 用 户 空 间 中 。 文 件 描述 符 1 连接 在 打开 的 文件 {ff 上。 为 了 
使 这 幅 图 清楚 易 理解 , 共 他 打开 的 文件 并 未 画 出 来 ， 














图 10. 11 在 调用 fork 之 同 的 进程 以 及 它 的 标准 输出 


2. 父 进程 调用 fork 之 后 

如 图 10.12 所 示 , 新 的 进程 出 现 了 。 此 进程 与 原始 进程 运行 相同 的 代码 ,但 它 知道 自己 
是 子 进 程 。 此 进程 包含 了 与 父 进程 相同 的 代码 :数据 和 打开 文件 的 文件 播 述 符 。 因 此 文件 
描述 符 1 依然 指向 的 是 文件 ff， 然后 子 进 程 调用 了 cose(D, 









指向 打开 的 文件 
I- 打开 文件 


B 10.12. 子 进程 的 标准 笨 出 从 父 进 程 那儿 忽 承 而 得 








3， 在 子 进 鹅 调 用 close(1) 之 后 
如 图 10. 13 所 示 , 父 进程 并 没有 调用 close C15 ,因此 父 进 程 中 的 文件 描述 符 1 仍然 指向 
{。 子 进程 调用 close(1) 之 后 .文件 描述 符 1 变 成 了 最 低 未 用 文件 描述 符 ， 子 进程 现在 试 着 
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六 可 用 的 表 项 
| IW C | 


图 10.13. FREER AT LAA br E S8 1 























4. 在 子 进 程 调用 creatC"g". m) z E 
如 图 10.14 所 示 ,文件 描述 符 1 被 连接 到 文件 g。 子 进程 的 标准 答 出 被 重 定向 到 g。 子 
进程 然后 调用 exec 来 运行 who, 














图 10.14 于 进程 打开 一 个 新 的 文件 得 到 fd=) 


5， 在 子 进 程 使 用 exec 执行 新 程序 之 后 

如 图 10.15 所 示 , 子 进 程 执 行 了 who 程序 。 于 是 子 进程 中 的 代码 和 数据 都 被 who 程序 
的 代码 和 数据 所 替代 了 ', 然 而 文件 描述 符 被 保留 下 来 。 打 开 的 文件 并 非 是 程序 的 代码 也 不 
是 数据 ,它们 属于 进程 的 属性 ,因此 exec 调用 并 不 改变 它们 。 








SRR me 子 进程 
—L- si 


指向 打开 文件 的 指 
针 是 进香 的 一 部 分 : 


| || | | 但 此 化 组 并 不 是 程 


| 序 中 的 数据 ， 














10.15. FURE NEUT H pr E e e E E 


who 命令 将 当前 用 户 列表 送 至 文件 描述 符 1。 其 实 这 组 字 节 已 经 被 写 到 文件 gg 中 去 了 ， 
而 who 命令 却 毫 不 知晓 。 
下 面 的 程序 whotofile. c 展示 了 上 面 所 涪 的 这 种 方法 : 
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/* whotofile.c 
* purpose: show how to redirect output for another program 
* idea; fork, then in the child, redirect output, then exec 
af 


H include  sZ8tdio. ho 


main() 

{ 
int pid; 
int fd; 


printf("About to run who into a File\n"); 


į» create a new process or quit x/ 

if( (pid = fork() ) == ~1)f{ 
pexrror("fork"); exit(1); 

i 

/* child does the work */ 

if ( pid == 0){ 


close(1); /* close, */ 
fd = creat( "userlist", 0644 5; /* then open */ 
execlp( "who", "who", NULL ); /* and run «/ 


perror("execlp'); 

exit(1); 
} 
/* parent waits then reports x/ 
if ( pid f= 001 

Wait(NULL); 


printf("Done running who. results in userlistXn") ; 


重 定向 到 文件 的 小 结 


共有 三 个 基本 的 概念 ,利用 它们 使 得 Unix 下 的 程序 可 以 轻易 地 将 标准 输入 、 输 出 和 错 
误 信息 输出 连接 到 文件 ， 

COD 标准 输入 .输出 以 及 错误 输出 分 别 对 应 于 文件 描述 符 0.1.2; 

(2) 内 核 总 是 使 用 最 低 可 用 文件 描述 符 ; 

(3) 文件 描述 符 集 合 通过 exec 调用 传递 , 且 不 会 被 政变 。 

shell 使 用 进程 通过 fork 产生 子 进 程 与 子 进 程 调用 exec 之 何 的 时 间 知 隔 米 重 定向 标准 
输入 .输出 到 文件 。 

shell 同样 支持 下 面 几 种 形式 的 命令 ， 





who >=> userlog 


sort « data 
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编写 可 以 支持 以 上 两 种 操作 的 代码 就 留 给 大 家 作为 练习 去 完成 . 
10.6 管道 编程 


现在 已 经 学 习 了 如 何 编 写 程序 将 标准 输出 重 定向 到 文件 。 下 面 将 要 讨论 如 何 使 用 管道 
来 连接 一 个 进程 的 输出 和 男 一 个 进程 的 输入 。 图 10. 16 展示 了 管道 的 工作 原理 。 管 道 是 内 
核 中 的 一 个 单 向 的 数据 通道 ,管道 有 一 个 读 取 端 和 一 个 写 人 端 ， 实现 who] sort 这 样 的 操 
作 , 需 要 两 种 技巧 : 如 何 创建 管道 ,以 及 如 何 将 标准 输入 和 输出 通过 管道 连接 起 来 。 





图 10. 16 两 个 进程 由 管道 连接 在 一 起 


10.6.1 创建 管道 
Bj 10. 17 所 示 即 为 一 根 管 道 ， 可 以 使 用 如 下 的 系统 调用 来 创建 管道 。 























pipe 
自 标 创建 管道 
头 文件 # include <unistd. hz» 
函数 原型 result = pipelim array[2])， 
参数 arrsy ”包含 两 个 int 类 型 数据 的 数组 
—1 发 生 错 误 
返回 值 0 成 功 


pipe (1} pipe 10] 





JAN 
210.17 Tb 


WA Pipe 来 创建 管道 并 将 其 西端 连接 到 两 个 文件 描述 符 。array[0] 为 读数 据 端 的 文件 
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播 述 符 ,而 array[1] 则 为 写 数据 端的 文件 描述 符 。 像 一 个 打开 的 文件 的 内 部 情况 一 样 , 管 道 


的 内 部 实现 隐藏 在 内 核 中 ,进程 只 能 看 见 两 个 文件 描述 符 。 
图 10.18 显示 了 进程 创建 一 个 管道 前 后 的 状 总 。 前 一 张 图 ( 漳 用 pipe 之 前 ?显示 了 标准 
文件 描述 符 集 。 后 一 张 图 ( 疯 用 pipe 之 后 ) 显 示 了 内 核 中 新 创建 的 管道 ,以 及 进程 到 管道 的 


两 个 连接 。 注意 ,类似 于 open 调用 ,pipe 调用 也 使 用 最 低 可 用 文件 描述 符 。 


调用 pipe 之 前 调用 pipe 之 后 

















T sum ET IIIA 


内 核 创 建 管道 并 设置 文件 描述 符 





进程 打开 一 些 常规 的 文件 
图 10. 18 ”进程 创建 管道 


FE ET pipedemo. c 展示 了 如 何 创 建 管道 并 使 用 管道 来 向 自己 发 送 数据 ， 


» Demonstrates; how to create and use a pipe 


/* pipedeno.c 
k x Effect, creates a pipe, writes into writing 
* end, then runs around and reads from reading 
x end. A little weird, but demonstrates the idea, 
»/ 


4 include «stdio. b> 
# include <Cunistd. h> 


main() 

{ 
int len, i, apipe [2]; /x two file descriptors  «/ 
char buf ['RIFSIZ]; /* for readinq end »/ 


/» get a pipe x/ 

if ( pipe ( apipe) == -1)| 
perror( "could not make pipe"); 
exit(3); 


) 
printf('"Got a pipe! It is file descriptors, ( gd gd }\n", 


apipe[0], apipe[ 1j); 
/* read from stdin, write into pipe, read from pipe, print +/ 


while ( fgets(buf, BUFSIZ, stdin) ){ 


len = strlen( buf ); 
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if ( write( apipe[1], buf, len) |= len)! /* send »/ 
perror( “writing to pipe"); /x down =/ 
break; /* pipe «/ 

) 

for (i = 0 ; ilen; i++ ) w wipe wi 


buf[i] = 'X'; 


len = read( apipe[0], buf, BUFSIZ) ; ‘a read x/ 

if (len == -1)( /* from »/ 
perror( "reading fron pipe"); /* pipe «/ 
break; /* pipe */ 

) 

if ( write( 1 , buf, len) != len )1{ /* eend «/ 
perror("writing to stdout"); jx to «/ 
break; /* pipe </ 

) 


} 


RI 10. 19 R7 TARA RUE MEE SI Pa. FA a) E E 2 MAE DB | £3 B9 
SEAS 8 DE 








图 10.19 mpedemo, c 中 的 数据 流 


现在 已 经 学 习 了 如 何 创 建 管道 , 如何 向 管道 中 写 数 据 以 及 旭 何 从 管道 中 读 取 数据 ， 实 
Kh ,很 少 会 有 程序 用 管道 向 自己 发 送 数据 .将 pipe 和 fork 结合 起 来 .就 可 以 连接 两 个 不 同 
的 进程 了 。 
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10.6.2 使 用 fork 来 共 京 管道 


当 进 程 创 建 一 个 管 庆 之 后 ,该 进程 就 有 了 连 向 管道 两 端的 连接 。 当 这 个 进程 调用 fork 
的 时 候 , 它 的 子 进程 也 得 到 了 这 两 个 连 向 管道 的 连接 ,如 图 10. 20 所 示 。 父 进程 和 子 进 程 都 
可 以 将 数据 写 到 管道 的 写 数 据 端 口 ,并 从 读数 据 端口 将 数据 读 出 ,如 图 10. 21 所 示 。 两 个 进 
程 都 可 以 恋 写 管道 ,但 是 当 一 个 进程 污 , 另 一 个 进程 写 的 时 候 , 管 道 的 使 用 效率 是 最 高 的 。 





共享 管道 ， 

PRMD. ABB 
管道 并 添加 过 接管 道 端点 的 文 
件 描述 符 指针 数组 


接着 进程 调用 fork. 内核 创 建 
一 个 新 进 释 并 从 父 进程 复制 连 
接管 近况 点 的 文件 描述 符 指针 
EE 


两 个 进程 邦 沪 疝 管道 的 两 山 




















图 16.21 进程 之 间 的 数据 流 


下 面 的 程序 pipedemo2. c 说 明了 如何 将 pipe 和 fork 结合 起 来 ,创建 一 对 通过 管道 来 通 
信 的 进程 。 


/* pápedemo2.c x Demonstrates how pipe is duplicated in fork() 
> * Parent contínues to write and read pipe, 
* but child also writes to the pipe 
*/ 


4 include <stdio.h> 


# define CHILD MESS "I want a cookie\n” 
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it define PAR MESS "testing. .\n" 
H#define ocops(m,x) { perror(m , exit(x); | 
main() 
{ 
int pipetd[2 |: /* the pipe  x/ 
int len; /* for wite — «/ 


char buf[BUFSIZ];  /* for read x / 


int read len; 


if ( pipe( pipefd } == -12 


cops( "cannot get a pipe", 1); 


switch( fork() )| 
case —1; 


oops("cannot fork", 2); 


/* child writes to pipe every 5 seconds x/ 


case 0; 
len = strlen(CHILD MESS); 
while (1 ){ 


if (write( pipefd|1], CHILD MESS, len) [= len) 
cops("write", 35; 
sleep(5); 
H 


/* parent reads from pipe and also writes to pipe x/ 


default. 
len = strlen( PAR MESS ); 
while ( 1 H 


if ( write( pipefd[1], PAR MESS, len)!* len ) 
oops( "write", 4); 
sleep(1); 
read len = read( pipefd[0], buf, BUFSI2Z); 
if ( read len <= 0) 
break; 


write( 1, buf, read len); 


10.6.3 使 用 pipe fork 以 及 exec 


本 章 已 经 介绍 了 各 种 技巧 和 感 路 来 编写 将 who 的 输出 连接 到 sort 的 输入 的 程序 。 大 家 
应 该 已 经 了 解 了 如 何 去 创 建 管道 ,如 何在 进程 癌 共享 管道 ,如 何 改变 进程 的 标准 输入 以 及 如 
何 改变 进程 的 标准 输出 。 
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在 这 里 可 以 将 这 所 有 的 技巧 结合 在 一 起 ,编写 一 个 通用 的 程序 pipe。 它 使 用 两 个 程序 的 
名 字 作 参数 ,例如 ， 


pipe who sort 





pipe 1s head 
程序 的 内 在 逻辑 如 下 所 示 : 
pipetp) 
fork() 
| 
+ -=-= v- + 一 一 -一 -一 €—— 
child parent 
: | 
close(p [0j) close(p|1]) 
dup2(p [1], D dup2€p[ 0 ],0) 
close(p [175 close(p[ 0]) 
exec "who" exec "sort" 


程序 代码 如 下 : 


/* pipe.c 

x Demonstrates how to create a pipeline from one process to another 
* * Takes two args, each a command, and connects 
* av[ 1s output to input of av[ 27 

* * usage: pipe command] command2 

* effect; command! | command2 

* * Limitations, commands do not take arguments 
* * uses execip(} since known number of args 

* * Note. exchange child and parent and watch fun 
x/ 

H include < stdio. F> 


# include < unistd. ho 
# define oops(m,x) { perror(m); exit(x); } 


main(int ac, char x * av) 


int thepipe[ 2], /* two file descriptors +*/ 
newfd, /* useful for pipes  x/ 
pid; /* and the pid = «/ 


if (ac l= 3) 
fprintf(stderr, "usage, pipe cmd1 cmd2Xn'); 
exit(1); 
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程序 pipe. c JH T RI shell 一 样 的 轧 路 和 技术 来 创建 管道 。 但 是 shel 并 不 像 pipe. c 一 样 
运行 外 部 程序 。shell 首先 创建 管道 ,然后 调用 fork 创建 两 个 新 进程 ,再 将 标准 输 人 和 输出 乔 


} 
if ( pipe( thepipe ) == -1) /* get a pipe x / 


oops( "Cannot get a pipe", 1); 





/* d ut aper ME Ec M 
/* now we have à pipe, now lets get two processes =f 
if ( (pid = fork()) == -1) /* get a proc xf 


oops("Cannot fork", 2); 


i 





/* Right Here, there are two processes s/f 
/* parent will read from pipe x} 
if € pid > 0 4 /* parent will exec av[2] xf 


close(thepipe[1]); ^ /* parent doesrt write to pipe 


if ( dup2(thepipe[0], 0) == -1) 


oops( "could not redirect stdin”,3); 


close(thepipe[0 j|); ^ /* stdin is duped, close pipe 
execlp( av|2], av[2], NULL); 
oops(av[2], 4); 

? 


/* child execs av[ 1] and writes into pipe x/ 
close(thepipe[0]); /* child doesrt read from pipe 
if ( dup2(thepipe[1], 1) == 1? 


oops( "could not redirect stdout", 4); 


close(thepipell]; /* stdout is duped, close pipe 
execip( av[1^, av[1;, NULL); 
cops(av[1], 5); 


定向 到 创建 的 管道 ,最 后 骨 通 过 exec 来 执行 两 个 程序 。 
10.6.4 技术 细节 : 管道 并 非 文 件 


管道 在 许多 方面 者 类似 于 普通 文件 。 进 程 使 用 write 将 数据 写 人 管道 ,又 通过 read TEX 
据 读 出 来 。 像 义 件 一 样 ,管道 是 不 带 有 任何 结 梅 的 字 节 序列 。 另 一 方面 ,管道 又 与 文件 不 
间 , 例 如 文件 的 结尾 是 否 也 适用 于 管道 呢 ? 下 列 技术 细节 清楚 地 阐述 了 文件 与 管道 的 相同 


点 与 不 同 点 。 


i% ne ao ———— MM 


Ki 


H 
外 ”了 
G 


xf 
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l 从 管道 中 读数 据 

(1) 管道 读 取 阻塞 

当 进 程 试 图 从 管道 中 读数 据 时 ,进程 被 挂 起 直到 数据 被 写 进 管道 。 那么 如何 避 多 进程 
永 无 止境 地 等 待 下 去 呢 ? 

(2) 管道 的 读 取 结 束 标志 

当 所 有 的 写 者 关闭 了 管道 的 写 数 据 端 时 ,试图 从 管道 读 取 数据 的 调用 返回 0, 这 意味 兰 
文件 的 结束 。 

《3) 密 个 读者 可 能 会 引起 麻烦 

管道 是 一 个 队列 。 当 进程 认 管 道中 读 取 数据 之 后 ,数据 已 经 不 存在 了 ， 如果 两 个 进程 
都 试图 对 同一 个 管道 进行 读 操作 ,在 一 个 进程 读 取 一 些 之 后 , 另 一 个 进程 读 到 的 将 是 后 面 的 
内 容 。 它 们 读 到 的 数据 必然 是 不 完整 的 ,除非 帅 个 进程 使 用 某 种 方法 来 协调 它们 对 管道 的 
访问 。 

2. 向 管道 中 写 数 据 

CD 写 人 数据 阻塞 直到 管道 有 空间 去 容纳 新 的 数据 

管道 容纳 数据 的 能 力 要 比 磁 盘 文件 差 的 多 。 当 进 竹 试图 对 管道 进行 写 操 作 的 时 候 , 比 
调用 将 挂 起 进程 直到 管道 中 有 足够 的 空间 去 容纳 新 的 数据 。 如 果 进 程 息 写 人 1000 个 字 节 ， 
潭 管道 中 现在 只 能 容纳 500 个 字 节 ,那么 这 个 写 入 调用 就 只 好 等 待 直到 管道 中 得 有 500 TE 
节 空 出 来 。 如 果 某 进程 试图 写 100 万 字 市 , 那 结 果 会 怎样 ?调用 会 不 会 永远 等 待 下 去 呢 ? 

(2) 写 人 必须 保证 一 个 最 小 的 块 天 小 

POSIX 标准 规定 内 核 不 会 拆 分 小 于 512 字 节 的 块 。 而 Linux 则 保证 管道 中 可 以 存在 
4096 字 节 的 连续 缓存 。 如 果 两 个 进程 向 管道 写 数据 ,并 日 每 一 个 进程 都 限制 其 消息 不 大 于 
512 守节 ,那么 这 些 消息 部 本 会 被 内 核 拆 分 。 

(3) 若 无 污 者 在 读 取 数据 , 则 写 操作 执行 失 骸 

如 果 所 有 的 读者 都 已 将 管道 的 读 取 端 关闭 ,那么 对 管道 的 写 人 调用 将 会 执行 失败 。 如 
果 在 这 种 情况 下 ,数据 还 可 以 被 接收 的 话 ,它们 会 到 哪里 去 呢 ? 为 了 避免 数据 持 失 ,内 核 采 
用 了 两 种 方法 来 通知 进程 :“ 此 时 的 写 操作 是 无 意义 的 "。 首 先 ,内 核发 送 SIGPIPE 消息 给 
进程 ， 车 进程 被 终止 , 则 无 任何 事情 发 生 。 和 否则 write 调用 返回 一 1, 并 县 将 errno BA 
EPIPE, 


小 结 


1. ERAS 

”输入 /输出 重 定向 允许 完成 特定 功能 的 程序 通过 交换 数据 来 进行 相互 协作 。 

Unix 默认 规定 程序 从 文件 描述 符 0 读 取 数据 , 写 数 据 到 文件 揪 述 符 1, 将 错误 信息 输 
出 到 文人 性 描述 符 2。 这 三 个 文件 描述 符 称 为 标准 输入 、 输 出 及 标准 错误 输出 。 

当 登 录 到 Unix 系统 中 ,登录 程序 设置 文件 描述 符 0、1,2。 所 有 的 连接 .文件 描述 符 
都 会 夫 父 进程 传递 给 子 进程 。 它 科 也 会 在 调用 exec 时 被 传递 。 

。 创建 文件 描述 符 的 系统 调用 总 是 使 用 最 低 可 用 文件 描述 符号 。 
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重 定 向 标准 输入 ,输出 以 及 错误 输出 意味 着 改变 文件 描述 符 0.1.2 的 连接 。 有 很 多 


种 技术 来 重 定向 标准 1/0. 
。 符 道 是 内 核 中 的 一 个 数据 队列 ,其 每 一 端 连接 -- 个 文件 描述 符 。 程 序 通过 使 用 pipe 
系统 调用 他 建 管道 。 
» 当 父 进程 调用 fork 的 时 候 , 管 道 的 两 端 都 被 复制 到 子 进程 中 。 
。 只 有 有 共同 父 进程 的 进 穆 之 间 才 可 以 用 管道 连接 。 
2. 下 一 步 做 什么 
传统 的 Unix 管道 在 进程 间 进 行 数 据 的 单 向 传输 。 若 商 个 进程 希望 来 回 传 递 数据 又 该 
如 何 ? 两 个 没有 关联 的 进程 或 两 个 进程 在 不 同 的 机 器 上 , 那 该 如 何 实现 呢 ? A Le, 
将 更 加 细致 地 研究 一 下 管道 以 及 网 络 编程 ,使 用 管道 的 思路 可 以 轻易 开 扩 展 到 套 接 字 
(socket) 上 去。 
3. 习题 


19.1 


10.2 


10.5 


10.6 


10.7 


T 5a VE shell Him BER INE EAE B. shell 是 使 用 自动 添加 和 模式 
CUS 5 齐 ), 还 是 简单 地 寻找 文件 的 结尾 并 从 这 里 开始 写 数据 ? 通过 shell 脚本 
设计 一 个 试验 来 回答 这 个 问题 。 


在 pipe. c 中 , 父 进 程 运 行 着 消费 数据 的 程序 , 子 进 程 运行 着 产生 数据 的 程序 。 如 
果 这 两 个 程序 的 角色 换 一 换 , 那 么 结果 有 何 差异 ”将 测试 语句 if Cpid 00 HH if 
(pid==0) ,角色 就 可 以 被 换 过 来 。 这 将 会 导致 什么 情况 的 发 生 ? HHA? 


若 需 要 shell 支持 管道 ,需要 怎样 做 改动 ? 首先 ,如 何 修 改 控制 流 来 识别 并 处 理 以 
SEA SHEN MO? 其 次 , 若 有 许多 命令 ,它们 之 间 通 过 管道 符号 来 分 割 , 那 
SOARES FE B ER nic? 


在 pipe. c 中 , 读 进 程 sort 关闭 了 从 父 进程 那里 复制 来 的 管道 写 数据 端 。 修 改 代 
码 让 该 进程 不 要 关闭 管道 的 写 数据 端 。 运 行程 序 , 并 对 结果 做 出 解释 。 


在 这 :- 音 的 开始 学 习 了 将 标准 输入 、 和 输出 重 定 册 到 文件 的 符号 。 知道 重 定向 符 
号 和 文件 名 可 以 出 现在 命令 行 中 的 任意 地 方 , 并 和 且 重 定向 符号 和 文件 名 没有 作 
为 参数 传递 给 程序 。 

前 面 编写 的 shell 中 ,在 控制 流 的 什么 地 方 识别 出 重 定 向 的 请 求 ” 何 处 实现 这 个 
Bel? BAP RA set varlist, 结果 又 如 何 ” 这 个 shell 会 允许 你 将 内 部 命令 
的 输出 重 定 回 吗 ”如何 将 此 功能 加 入 自己 编写 的 shell 中 呢 ? 


若 用 户 输入 sort<data> data, ARS án fof? 这 个 命令 的 问题 生 在 ? 标准 Unix 
shell 如 何 处 理 这 一 问题 呢 ? 自己 所 写 的 shell 又 该 如 何 去 处 理 这 个 问题 呢 ? 


已 经 学 当 了 如 何 将 程序 的 标准 输入 输出 连接 到 一 个 文件 。 上 面 所 有 的 例子 中 都 
假设 这 里 的 文件 是 常规 磁盘 文件 .那么 是 否 可 以 将 输 人 输出 时 定 向 到 设备 文件 
pie? 如 果 调 用 了 close(0) 和 open("/dev/tty”.0) ,结果 会 如 何 昵 ?shell Zany 





-来 处 理 命令 whol /dev/tty 的 ? 


第 10 章 IOD 重 定向 和 管道 * 323 。 





10.8 Æ pipe. ec 中 ,调用 了 fork 和 exec 函数 ,但 是 并 没有 调用 wait。 这 是 为 什么 ? 


10.9 


讨论 一 下 dup 与 link 的 共同 点 与 区 别 。 


4, 编程 练习 


10.10 


10.11 


19. 12 


10.13 


10.14 


180. 15 


修改 脚本 watch. sh ,使 它 可 以 有 更 多 的 功能 ， 

CL) 除了 打印 所 有 表 户 的 登录 和 注销 情况 外 ,新 的 版 本 要 求 可 以 通过 命令 行 参 
数 米 传递 一 个 包 信 要 监控 的 用 户 列 表 文 件 。 

(2) 修改 后 的 程序 仅仅 当 有 新 的 用 户 登 录 或 注销 时 , 才 将 结果 打印 出 米 . 而 不 是 
每 次 循环 都 打印 一 些 内 容 。 

(3) who 命令 除了 列 击 用 户 名 之 外 还 有 党 录 时 间 .终端 名 称 等 。 吕 能 对 其 用 户 
在 娜 个 终端 窗口 登录 并 不 感 兴趣 。 修改 程序 使 其 仅仅 当 用 户 从 登录 状态 变 
到 非 登 录 状 态 时 才 报 告 结果 ,而 不 去 考 虚 终 端的 变化 。 

(D 早期 的 Unix 版 本 将 数据 存储 在 当前 目光 下 的 文件 prev 和 curr H, 3 HE 
程序 停止 运行 时 ,并 没有 对 这 两 个 文件 做 处 理 , 这 样 的 设计 有 哪些 缺点 ? 
修改 脚本 ,使 其 使 用 临时 的 文件 ,并 在 结束 运行 的 时 候 删 除 它们 。 看 一 下 如 
何 使 用 shell 中 的 trap 命令 以 及 mktemp 命令 。 


修改 whotofile. c 程序 ,使 其 将 who 命令 的 输出 添加 到 一 个 文件 的 末尾。 确保 
在 此 文件 不 存在 时 ,程序 照样 可 以 正常 运行 。 


Ai — 4H sortfromfile. c 的 程序 ,将 sort 命令 的 输入 重 定向 ,使 其 从 文件 中 
读 人 数据， 文件 名 由 命令 行 参 数 来 指定 。 


扩展 pipe. 程序 米 处 理 … WAI. BRAS AY Unix 程序 可 以 接收 三 个 程序 名 
称 作为 参数 ,并 让 它们 以 管道 的 方式 交互 数据 。 命 令 


Pipe3 who sort head 


应 该 和 who|sort|head 起 到 相同 的 作用 。 
扩展 上 题 的 程序 pipe3 使 其 可 以 处 理 任意 多 的 参数 。 
tee 工具 允许 重 定向 数据 到 文件 并 且 将 数据 传递 给 另 -个 程序 .例如 ， 


who|tee userlist |sort — list2 
产生 一 个 未 排序 文件 和 一 个 排序 文件 : userlist H list2, (FA tee 的 参数 是 一 个 
文件 名 ,可 以 从 参考 手册 得 到 更 详细 的 信息 。 编 写 一 个 名 叫 progtee 的 程序 来 
重 定 向 数据 到 程序 ,同时 通过 管道 将 数据 传递 给 另 一 个 程序 。 例 如 命令 ， 
who|progtee mail smith sort|progtee mail -s "hello" 


root — list? 


将 一 个 末 排 序 的 列表 作为 邮件 发 给 smith ,将 排 好 序 的 文件 发 给 root, E ME— 0) 
排 好 认 文 件 的 备份 放 到 文件 list2 中 。 
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写 数 据 到 标准 输出 的 程序 往往 并 不 在 意 文件 描述 符 是 联结 到 终端 还 是 磁 盐 文 
件 。 本 章 中 似乎 暗示 进程 并 没有 方法 米 了 解 文件 描述 符 的 指向 。 其 实 这 并 不 
IEW. FERE isatty(fd) 中 以 用 来 做 判断 : 车 文件 描述 符 fd 指向 终端 , 则 函数 
返回 为 true,isatty 使 用 系统 调用 fstat。 阅 读 一 下 关于 [stat 的 介绍 ,并 月 用 它 
*3 — TRR isaregfile(id) ,使 其 在 所 指向 常规 磁盘 文件 时 返回 true, 








第 11 章 连接 到 近 端 或 远 端 的 进程 : 
服务 器 与 Socket( 套 接 字 ) 





概念 和 技巧 

， 客户 /服务 器 模型 

- 用 管道 来 双向 通信 

« 协同 进程 (coroutines) 

"文件 /进程 的 相似 性 

* 什么 是 socket ,为 什么 需要 socket, Wtf iE H socket 
。 网 络 服务 

。 用 socket 编写 客户 /服务 器 程序 
1X HEUS Ra is 

* fdopen 

* popen 

* socket 

* bind 

* listen 

* accept 


* connect 


11.1. 产 草 和 服务 


像 制 造 商 利用 传送 带 在 工人 之 间 传 递 产品 一 样 ,Unix 程序 员 可 以 通过 管道 米 传 送 数字 
信息 。 
并 非 所 有 的 商务 过 程 都 是 像 工 三 的 生产 线 一 样 是 单 向 流动 的 , 某 些 形 式 的 通信 方式 
是 双向 的 。 考 上 囊 一 下 农 服 于 洗 店 、 律 师 还 有 兽医 。 你 在 把 衣服 交 给 十 洗 店 ,把 宠物 送 到 兽 
医 那 边 , 或 是 将 文档 通过 e-mail 发 给 律师 之 后 ,只 需 等 待 他 们 把 处 理 好 的 东西 发 回 ,而 并 不 
需要 像 汽 车 工厂 里 的 土 人 那样 把 车 传递 给 下 一 个 工人 。 在 这 个 例子 中 ,需要 由 其 他 人 完 
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成 的 工作 就 称 之 为 服务 ,而 自己 则 是 狠 务 的 客户 。 

上 面 的 例子 跟 Unix 有 什么 关系 呢 ? Unix 中 的 管道 可 以 把 数据 从 一 个 进程 传送 到 另外 
一 个 进程 。 进 程 和 管道 不 但 类 似 于 寺 条 生产 线 来 完成 产品 ,还 类 似 于 一 个 大 的 服务 产业 。 
本 章 将 关注 于 进程 间 的 数据 通信 ,这 也 是 客户 /服务 器 编程 的 基础 知识 ， 


11.2. 一 个 简单 的 比喻 : 饮料 机 接口 


程序 处 理 信息 就 像 人 们 消耗 饮料 一 样 。 以 图 11. 1 中 的 自动 碳酸 饮料 机 为 例 , 在 你 投 
和 人 硬币 , 按 下 按钮 之 后 ,饮料 就 自动 流出 。 在 此 过 程 中 ,饮料 宙 内 的 分 配器 在 做 什么 工作 
呢 ? 在 饮料 机 内 .应 该 有 一 桶 碳酸 水 和 另 一 捅 浓缩 的 饮料 汗水; 当 按 下 按钮 时 ,将 激活 一 
个 配制 原材料 并 不 断 地 传送 出 产生 的 三 酸 饮 料 的 过 程 。 另 一 种 方法 则 是 只 需要 将 一 撕 预 
先 配制 好 的 三 蕉 饮料 装 到 一 个 抽水 泵 上 . 按 于 按钮 这 个 动作 就 简单 地 将 饮料 抽出 并 送 给 
外 面 的 杯子 。 


搅拌 器 R 


IUE SERT 来 生存 储 部 分 
8 ILI 动态 产生 或 来 自 柄 态 饮料 


就 像 碳酸 饮料 分 配器 一 样 、Unix 提供 一 个 接口 来 处 理 可 能 来 自 不 同 数据 源 的 数据 ,如 
11. 2 所 示 。 








4 RAS ROS Dn S 


l. 
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图 11,2 一 个 接口 和 不 同 的 数据 源 


© ODER, BRAX 

用 open 命令 连接 ,用 read 和 write 传递 数据 。 

。 (3) 管 道 

用 pipe 命令 创建 ,用 fork 共享 ,用 read 和 write 传递 数据 。 








PDR 连接 到 近 端 或 远 端的 进程 : 服务 器 与 Socket( 套 接 字 》 " 337 s 








* (4)Sockets 
用 socket, listen 和 connect 连接 ,用 read 和 write 传递 数据 。 


11.3 be: Unix 中 使 用 的 计算 器 


儿 平 每 个 版 本 的 Unix 都 包含 be 计算 器, 尽管 这 些 计 算 器 的 版 本 有 些 差 异 。bc 计算 器 
vq da asc. . 插 环 和 函数 的 功能 ,并 如 在 第 1 章 中 所 看 到 的 那样 支持 对 长 整数 的 处 理 ， 


S be 

174123 
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每 行 末 尾 的 反 斜 线 表 示 数 字 行 的 继续 。 

] be 并 不 是 一 个 计算 器 

一 个 计算 器 程序 分 析 它 的 输 人 ,执行 操作 ,然后 将 输出 打印 出 来 。 大 部 分 版 本 的 be 程序 
都 只 分 析 和 给 人 ,并 不 执行 操作 对 。 其 实 ,be 在 内 部 启动 了 dc 计算 器 程序 ,并 通过 管道 与 其 进 
行 通 信 。dc 是 一 个 基于 栈 的 计算 器 , 它 需 要 用 户 在 指定 具体 的 操作 符 之 前 , 先 输 人 所 要 操作 
的 数据 。 例 如 ,用 户 输入 2 2 十 来 代表 2 加 2 的 操作 。 

图 11.3 显示 了 bc 如 何 来 处 理 2 十 2 的 过 程 : 用 户 输 人 2 十 2. 然 后 按 回 车 。bc 从 标准 输 
人 恋 吧 该 表达 式 . 分 析出 数据 和 操作 符 , 接 下 来 把 -一 系列 的 命令 *2”,“2"， 十 "和 p 传 给 de， 
dc 则 将 数据 入 栈 . 运 行 加 操作 , 梳 后 把 栈 顶 的 数值 送 到 标准 输出 。 





加 11.3 bc fide 作为 协同 进程 


bc 从 连接 到 dc 标准 输出 的 管道 上 恋 取 结果 ,再 把 结果 转发 给 用 户 。 这 样 的 话 ,bc 甚至 
BERERA. MRAPA x 二 2 十 2,be 告诉 dc 执行 该 损 作 并 且 把 结果 存 到 寄存 器 
x 中。 命令 bc -~c 可 以 显示 分 析 器 传 给 计算 器 的 数据 ;就 连 GNU 版 本 的 bc 也 是 把 用 户 的 
和 输入 转换 成 基于 栈 的 后 级 表达 式 。 

2， 从 bc 方法 中 得 到 的 思想 

(1) 客户 /服务 器 模型 

bc/dc 程序 对 是 客户 /服务 器 模型 程序 设 寺 的 一 个 实例 。dec 提供 服务 : 计算 。dc 所 识别 
的 语言 是 众所周知 的 逆 波 兰 表示 法 。be 和 de ZA HERA stdin 和 标准 输出 stdout 进 
TAW. be 提供 用 户 界 面 ,并 使 用 dc 提供 的 服务 。 这 里 bc 被 称 为 dc 的 客户 。 





D GNU 版 本 的 bc 是 执行 计算 操作 的 。 
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这 两 个 部 分 是 根本 上 独立 的 程序 .。 可 以 使 用 不 同 版 本 的 dc, 这 并 不 影响 bc 1E TE CL E 
类 似 地 ,可 以 编写 一 个 图 形 界 面 的 bc, 而 仍 用 dc 作为 计算 引 繁 。 甚 至 可 以 用 这 样 一 个 程序 
来 替换 de， 该 程序 先 分 析 dc 所 识别 的 语言 ,然后 把 它 所 变 做 的 工作 传 给 可 能 位 于 男 一 台 更 
高 速 计 算 机 上 的 程序 。 

(2) 双向 通信 

客户 /服务 器 模 锭 不 同 于 生产 线 的 数据 处 理 模 型 , 它 要 求 一 个 进程 既 跟 另 一 个 进程 的 标 
准 输入 也 要 积 它 的 标准 输出 进行 通信 。 传统 的 Unix 的 管道 只 是 单方 向 地 传送 数据 中 ,图 11. 
3 给 出 了 bc 和 de 之 间 的 两 个 管道 ,其 中 上 硬 的 管道 把 一 些 计 算命 令 传 给 dc 的 标准 输入 .下 
面 的 管道 把 dc 的 标准 答 出 传 给 be. 

QD 永久 性 服务 

be 只 是 让 单一 的 dc 进程 处 于 运行 状态 ,这 就 不 同 于 shell 程序 ,这 种 程序 中 的 每 个 用 户 命 
令 都 创建 一 个 新 的 进程 。bc 程序 持续 不 断 地 和 de 的 同一 个 实例 进行 通信 .把 用 户 的 输 人 转换 
成 命令 传 给 由 。 他 们 之 间 的 关系 并 不 同 于 标准 函数 中 所 使 用 的 调用 返回 机 制 。 

bc/dc 对 被 称 之 为 协同 进程 (coroutines) 以 用 来 区 别 于 子 程 序 (subroutines)。 两 个 程序 
都 持续 运行 , 当 其 中 的 一 个 程序 完成 自己 的 工作 后 将 把 控制 权 传 给 另 一 个 程序 ，bc 的 任务 
是 分 析 输 人 及 打印 ,而 de 则 负责 计算 。 


11.3.1 编写 bc: pipe、fork、dup、exec 


图 11.4 显示 了 内 核 将 用 户 连 接 到 be 并 将 be 连接 到 :de 的 数据 连接 。 这 里 以 该 图 作为 
编写 下 而 代码 的 指南 ， 

(D 创建 两 个 管道 ， 

(2) 创建 一 个 进程 来 运行 dc. 

(3) 在 新 创建 的 进程 中 ,; 重 定向 标准 输入 和 标准 输出 到 管道 ,然后 运行 exec de, 

(A) 在 父 进 程 中 , 读 取 并 分 析 用 户 的 输入 ,将 命令 传 给 dc, dc 读 取 响应 ,并 把 响应 传 给 
HP. 





图 11.4 bc,dc MRE 





D 有 一 些 管 首 也 能 双向 传输 数据 ( 见 小 结 中 编程 练习 11. 11)。 
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FP ai tinybe. c 的 源 程序 ,这 是 一 个 简单 版 本 的 be. FH sscanf 4r Tr AL Hitt P3 
道 与 de 通信 。 


je tinybe.c * & tiny calculator that uses dc to do its work 
»*»* * demonstrates bidirectional pipes 

xx * input looks like number op number which 

** tinybc converts into number Xn number in op \n p 
* o and passes result back to stdout 

Xx 

x Se cm ee Sr atf + 二 一 一 一 一 一 一 一 一 一 + 
x stdin 70 == pipetodc === = | 
* x | tinybc | i de 一 | 
*x* stdout «^1 <== pipefromdo --« | 
xo 二 一 一 一 一 一 - --- -+ 1 一 一 一 一 一 一 一 一 一 一 + 
# 

ux * program outline 

*x* a. get two pipes 

** b. fork (get another process) 

xx c. in the de - to- be process, 

* % connect stdin and out to pipes 

Xx then execl dc 

*x d. in the tinybc - process, no plumbing to do 
+x just talk to human via normal i/o 

*x and send stuff via pipe 

X x e. then close pipe and do dies 

x * note; does not handle multiline answers 

x af 


d 


d include  «stdio. h> 


f define cops(m,x) ! perror(m); exit(x); } 
mainí) 
i 
int pid, todc[2], fromdc[2]; /* equipment */ 


/x make two pipes */ 


if ( pipe(todc) == -1 || pipe(fromdc) == -1) 
oops( "pipe failed",1); 


/* get a process for user interface ¥/ 


if ( (pid = fork()) =~ -1) 


oops( "cannot fork", 2); 
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/* child is dc «/ 


if (pid == 0) 
be dc(todc, fromdc); 

else [ 
be_be(todc, fromdc); /* parent is ui */ 
wait (NULL) ; /* wait for child x/ 


be dc(int in[2], int out[2]) 


fx 
* set up stdin and stdout, then execl dc 
ef 
i 
/* setup stdin from pipein */ 
if ( dup2(in[0],Q) == -1) /* copy read end to 0 x/ 
oops("dc, cannot redirect stdin",3); 
close(in[0 D ; /* moved to fd 0 x/ 
eloseCin[1]); /x won't write here »/ 
/* setup stdout to pipeout x/ 
if ( dup2(out[1], 1) == -1) /* dupe write end to 1 «/ 
oops("dc, cannot redirect stdout",4); 
elose(out[ 15; /* moved to fd 1 «/ 
close(out[0]); /* won't read from here »/ 
/* now execl de with the - option x/ 
execlp("do", "dc", "— *, NULLO; 
oopst "Cannot run dc", 5); 
} 
be bc(int todc[2], int fromde[2]) 
pd * 
* read From stdin and convert inLo to RPN, send down pipe 
x then read from other pipe and print to user 
x Uses fdopen() to convert a file descriptor to a stream 
*/ 
1 
int numl, num2; 
char operation[ BUFSIZ], message[BUFSIZ], * fgets(); 
FILE * fpout, * fpin, * fdopen(); 
/* setup «/ 
close(todc[0]) ; /* won't read from pipe to dc «/ 


close(fromdc[ 13) ; /* won't write to pipe from de xy 
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fpout = fdopen( todc[1], "w" 2; /* convert file desc 一 »*/ 
fpin = fdopen( fromdc[0 ], "r" ); /* riptors to streams a/ 
if fpout == NULL ;| fpin == NULL) 


fatal( "Error convering pipes to streams"); 

/* main loop x/ 

while ( printf("tinybc. "), fgets(message,BUFSIZ,stdin) ! = 
NULL )| 


/* parse input «/ 

if ( sscanf(message," €$d* [- + «/^]$d", 
&nuni ,operation,&ntum2)! = 3)1 
printf("syntax error\n") > 


continue; 


if ( fprintf( fpout , "& dn & din & cnpAn", numi, num2, 
* operation ) == EOF > 
fatal("Error writing"); 
fflush( fpout ); 
if ( fgets( message, BUFSIZ, fpin ) == NULL) 
break; 
printf("$d &c $d = *s", numl 


, * Operation , numZ, message); 
; 

fclose(fpout); /* close pipe */ 
felose(fpin) ; /* do will see EOF «/ 


t 


fatal( char x mess[]? 

| 
fprintf(stderr, "Error: % s\n", mess); 
exit(1) H 


下 面 是 tinybe 的 运行 过 程 : 


$ cc tinybce.c - o tinybc ; . /tinybe 
tinybc: 2*2 

2412724 

tinybc. 55^5 

5545 = 5032B4375 

tinybc: 


仔细 观察 程序 的 输出 EE CELL REA) ER EUST S tinybe 产生 了 提示 符 并 再 一 
次 显示 出 算术 表达 式 。 计 算 的 结果 是 由 de 产生 的 字符 串 ,tinybe 只 是 从 管道 中 读 取 该 字符 
串 然 后 把 它 传 给 输出 ， 
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11.3.2 对 协同 进程 的 讨论 


其 他 的 一 些 Unix 工具 是 否 也 能 被 看 成 协同 进程 呢 ? sort 工具 能 否 被 当做 协同 进程 使 
Al? 答案 是 否定 的 。 在 sort 产生 输出 之 前 , 它 读 取 文件 中 所 有 的 数据 。 通 过 管道 来 传送 文 
件 结尾 标志 的 惟一 途径 是 将 写 数 据 端 关闭 。 一旦 关闭 了 写 的 进程 ,就 不 能 再 传送 其 他 需要 
排序 的 数据 了 。 

从 另 一 方面 齐 ,dc 是 逐 行 处 理 数 据 和 命令 的 。 与 de 的 交互 很 简单 并 可 预测 。 当 需要 de FT 
印 一 个 数据 时 ,将 会 得 到 一 行文 本 。 当 需要 dc 把 数据 压 栈 时 ,不 会 有 响应 被 传 岂 。 

一 个 客户 /服务 器 模型 程序 费 成 为 协同 系统 必须 有 明确 指明 销 息 结束 的 方法 ,并 且 程 序 
必须 使 用 简单 并 可 预测 的 请 求 和 应 答 。 


11.3.3 fdopen: 让 文件 描述 符 像 文件 一 样 使 用 


在 tinybe. c P4E FH T Æ eR XX. fdopen, fdopen 与 fopen 类 似 , 返 回 一 个 FILE * 类 型 的 
值 , 不 同 的 是 此 活 数 以 文件 描述 符 而 非 文 件 作 为 参数 ， 

使 用 fopen 的 时 候 , 将 文件 名 作为 参数 传 给 它 ，fopen 可 以 打开 设备 文件 也 可 以 打开 常 
规 的 磁盘 文件 。 如 只 知道 文件 描述 符 而 不 清楚 文件 名 的 时 候 可 以 使 用 fdopen 命令 。 例 如 在 
管道 的 例子 中 ,把 一 个 通 向 管道 的 连接 转换 成 FILE « 类 型 值 之 后 ,就 可 以 使 用 标准 缓存 的 
1/O 操作 来 对 其 进行 操作 了 ， 注 意 tinybe. c 是 如 何 使 用 fprintf 和 igets 来 通过 管道 和 de 进 
行 通信 的 。 

使 用 fdopen 使 得 对 远 端 的 进程 的 处 理 就 如 同 处 理 常 规 文件 一 样 。 下 一 节 将 剖析 popen 
网 数 ,此 函数 通过 封装 pipe. fork, dup 和 exec 等 系统 调用 使 得 对 程序 和 文件 的 操作 变 成 了 
~~ [a] SF 








11.4 popen: 让 进程 看 似 文件 
这 一 节 将 继续 学 习 一 个 程序 如 何 通 过 和 另外 一 个 进程 通信 来 得 到 服务 。 本 节 还 将 剖析 
popen HE pa 3X, BAA popen 及 其 工作 原理 ,最 后 给 出 popen 实现 版 本 。 
11.4.1 popen 的 功能 
fopen 打开 一 个 指向 文件 的 带 缓存 的 连接 ， 


FILE * fp; /* a pointer to a struct */ 

fp = fopen("filel","r"); /* args are filename,comection type */ 
e= gete( fp); /* read char by char «/ 

fgets(buf, len, fp); /* line by line x/ 

fscanf(fp," € d' € d s", &x,&y, x2 ; /* token by token «/ 

fclose(fp); /* close when done +/ 


fopen 需要 两 个 字符 串讲 量 作为 参数 : 文件 各 和 连接 类 型 (例如 , “rT”、*w”、“a”、…)。popen 
看 上 去 跟 fopen 很 类 做 。popen 打开 一 个 指向 进程 的 带 缓冲 的 连接 : 
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FILE x fp; 


fp = popen( "is". "gny 


Fgets(buf,len, fp); 


pclose( Fp); 


/ same type of struct x/ 
/* args are program name, connection type */ 
/* exactly the same functions #/ 


/* close «hen done */ 


图 11.5 显示 了 popen 和 fopen 之 间 的 相 做 性 。 商 者 使 用 相同 的 语法 格式 ,并 具有 相同 
的 返回 值 类 型 。pepen 的 第 一 个 参数 是 要 打开 的 命令 的 名 称 ; 它 可 以 是 任意 的 shell 命令 。 
第 二 个 参数 可 以 是 “r" 或 “w” ,但 决 不 会 是 "a”， 








popen (“Is”. "r^) 


fopen ("Me", ^r") 


11.5 fopen 和 popen 


下 面 的 程序 将 who|sor 作为 数据 源 , 通 过 popen 来 获得 当前 用 户 排序 列表 


/* popendemo. c 


4 demonstrates how to open a program for standard i/o 


> important points, 


X 


D 


l. 
2. 


popen() returns a FILE * , just like Fopen() 
the FILE « it returns can be read/written 
with all the standard functions 


. you need to use pclose() when done 


# include <stdio.h> 
# inclode < stdlíb. ho 


int main() 


{ 


FILE x fp; 

char buf[ 100]; 

int i = Q; 

fp = popen( "who|sort", "r"); /x open the command »/ 


while ( fgets( buf, 100, fp) f= NULL) /x read from command »/ 
printf(" 3d %s", i++, buf 5; /* print data x/ 


pclose( fp ); 


return 0; 


/* IMPORTANT! »/ 
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第 二 个 例子 将 popen 和 邮件 程序 相连 接 , 用 来 提示 用 户 一 些 系统 故障 : 


/* popen ex3.c 
shows how to use popen to write to a process that 


* 

+ reads from stdin, This program writes email te 
a two users. Note how easy it is to use fprintf 
* 


to format the data to send. 


: 
LI 


# include  —stdio.h— 


maint} 


( 
FILE * fp; 
fp = popen( "mail admin backup", "w" 95; 
fprintf( fp. "Error with backup!! in" 5; 


pelose( fp); 
\ 


pelose 命令 是 必须 的 。 

当 完 成 对 popen 所 打开 连接 的 读 写 后 ,必须 使 用 pclose 关闭 连接 ,而 不 能 用 fclose。 进 
程 在 产生 之 后 必须 等 待 进 出 运行 ,否则 它 将 成 为 擂 尸 进程 (zombie)。 而 pelose 中 调用 了 
wait 函数 来 等 待 进程 的 结束 。 
11.4.2 实现 popen: 使 用 fdopen 命令 

popen 是 如 何 工作 的 ”如 何 来 实现 它 ”popen 运行 了 一 个 程序 并 返回 指向 该 程序 标准 
输入 或 标准 输出 的 连接 。 

这 里 需要 -个 新 的 进程 来 运行 程序 ,所 以 要 用 到 fork 命令 。 需 要 一 个 指向 该 进程 的 连 
接 , 因 此 需要 使 用 管道 。 并 县 使 用 dopen 命令 将 一 个 文件 描述 符 定向 到 缓冲 流 中 。 最 后 ,在 
该 进程 中 要 能 够 运行 任何 shell 命令 ,所 以 要 用 到 exec。 但 是 会 运行 什么 程序 呢 ? 惟一 能 够 
运行 任意 shell 命令 的 程序 是 shell 本 身 即 /bin/sh。 为 了 使 程序 员 可 以 方便 的 使 用 ,sh 支持 
-c 选项 ,用 以 告诉 shell 执行 某 命令 然后 退出 。 例 如 ，: 


sh -c "who|sort" 


告诉 sh 执行 命令 行 wholsort, fill 11.6 所 示 。 
这 里 合并 了 pipe, fork dup? 和 exec 等 系统 油 用 ,其 流程 如 下 : 


pipe(p) 
forkí() 
| 


* Se - c me wur mm z + 








close(p[1]); close(p[ 0; 
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fp = fdopen(p[0], "775; 


return fp; 





dup(p[ 1 ), 15; 
close(p| 17); 
exec("/bin/sh", "sh"," — c", cmd, NULL) ; 


sh -c *ls" 


图 11.6 从 shell fig "FEX 


下 面 的 程序 popen. c Æ E W m E B—-^ 3:38; 


/* popen.c — a version of the Unix popent) library funcrion 


* FILE + popen( char * command, char x mode ) 


x 


W 


a 


k 


command is a regular shell command 


mode is "r" or "w^ 


returns a stream attached to the command, or NULL 


execls "sh" "— c" command 


x togo; what about signal handling For child process? 


x/ 

dinclude <stdio.h> 
g include <signal. h> 
4 define READ 0 


# define WRITE 1 


FILE + popen(const char x command, const char » mode) 


{ 


int pfp[2], pid; 
FILE x fdepen(), * fp; 
int parent end, child end; 
if ( * mode == 'r' )l 
parent end - READ; 
child end = WRITE ; 
} else if ( t mode == 'w' }{ 


parent end - WRITE: 
child end = READ; 


1 


} else retum NULL ; 


if ( pipe(pfp} == -1) 


return NULL: 


/* the pipe and the process x/ 
/* fdopen makes a £d a stream «/ 


/* of pipe «/ 


/[* €iguce out direction */ 


/* get a pipe »/ 
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if ( (pid = fork()) == 
close(pfp[0]); 
closetpfp[1]); 
return NULL; 

} 





ce 


21M /* and a process */ 


/* or dispose of pipe x/ 


parent code here —-—---: 和 +f 


/* need to close one end and fdopen other end x/ 


if C pid > 001 


if (closet pfp[child end] ) -= -1> 
return NULL; 


return fdopen( pfp[parent end] , mode) ;/* same mode «/ 


child code here --- 7-55 5 o wee non xj 


/* need to redirect stdin or stdout then exec the cmd x/ 


if ( close(pfp[|parent end) == -1 }/* close the other end +/ 
exit(1); /* do NOT return */ 

if ( dup2(pfp[child end], child end) == -1) 
exit(1); 

if ( close(pfp[child end] -- -1) ix done with this one &/ 
exit(l); 


execl( "/bin/sh", "gh", "oen 


exit(1); 
} 


¿x all set to run cmd x/ 


command, NULL 2; 


E 


该 版 本 的 popen 对 售 导 不 做 任何 处 埋 。 这 是 不 是 有 问题 ? 
11.4.3 访问 数据 : 文件 .应 用 程序 接口 {API) 和 服务 器 


[open 从 文件 获得 数据 ,而 popen 从 进程 获得 数据 。 这 里 主要 关注 一 下 数据 访问 的 普遍 
问题 并 对 三 种 实现 方法 进行 比较 。 将 以 获取 登录 系统 的 用 户 列表 为 便 来 比较 三 种 访问 数据 


的 方法 。 


* 方法 1: 从 文件 获取 数据 


可 以 通过 读 取 文件 来 获取 数据 。 第 2 章 所 写 的 who 程序 就 是 从 ump 文件 中 读 取 数据 的 。 
基于 文件 的 信息 服务 并 不 是 很 完美 。 客 户 端 程 序 依赖 于 特定 的 文件 格式 和 结构 体 中 的 特定 成 
员 名 称 。 下 面 的 Linux 头 文件 定义 中 utmp 结构 体 的 几 行 代码 清楚 地 展示 了 这 一 点 。 


/*Backwards compatibility hacks. «/ 


H define ut name ut user 
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， 方法 2; ARRRR BE 

可 以 通过 调用 函数 来 得 到 数据 。 一 个 库 函 数 用 标准 的 函数 接口 来 封装 数据 的 格式 和 
(2. Unix 提供 了 污 取 utmp 文件 的 函数 接口 getutent 的 帮助 信息 描述 了 读 取 ump 数 
据 库 函 数 的 细节 。 这 样 的 话 , 就 算 底层 的 存储 结构 变化 了 ,使 用 这 个 接口 的 程序 仍 能 正常 
工作 。 

使 用 甘于 应 用 程序 接口 (AP1) 的 信息 服务 也 并 不 一 定 是 最 好 的 方法 。 有 两 种 方法 可 
以 使 用 库 泌 数 。 一 个 程序 可 以 使 用 静态 连接 来 包含 实际 的 函数 代码 。 但 是 这 些 隐 数 有 可 
能 包含 的 并 不 是 正确 的 文件 名 或 文件 格式 , 59 — H i — TARP TUR SY 88 
数 ,但 是 这 些 共 章 库 也 并 不 是 安装 在 所 有 的 系统 上 ,或 者 其 版 本 并 不 是 程序 所 要 使 用 的 
版 本 。 

= HES; 从 进程 获取 数据 

第 三 种 方法 是 从 进程 中 读 取 数据 。bc/ de 和 popen 例子 显示 了 如 何 创 建 一 个 进程 到 另 
外 一 个 进程 的 连接 。 一 个 要 得 到 用 户 列表 的 程序 可 以 使 用 popen 来 建立 与 who 程序 的 连 
fe. A who 命令 来 负责 使 用 正确 的 文件 名 和 文件 格式 以 及 正确 的 库 泪 数 , 而 不 是 你 的 程序 。 

调用 独立 的 程序 获得 数据 还 有 其 他 的 好 处 。 服 务 器 程序 可 以 使 用 任何 程序 设计 语言 编 
fj. shell MAC Java 或 是 Perl 都 可 以 。 以 独立 程序 的 方式 实现 系统 服务 的 最 大 好 处 是 客 
产 端 程序 和 服务 器 端 程序 可 以 运行 在 不 同 的 机 器 上 。 所 有 要 做 的 只 是 和 不 同 机 器 上 的 一 个 
进程 相连 接 。 


11.5 socket: 与 远 端 进程 相连 


管道 使 得 进程 向 其 他 进程 发 送 数据 就 像 向 文件 发 送 数据 一 样 容易 ,但 是 管道 具有 两 
个 重大 的 缺陷 。 管 道 在 一 个 进程 中 被 创建 ,通过 fork 来 实现 共享 。 因 此 ,管道 只 能 连接 相 
关 的 进程 ,也 只 能 连接 同一 台 主 机 上 的 进程 。Unix 提供 了 另外 一 种 进程 间 的 通信 机 制 
socket, 
socket 允许 在 不 相关 的 进程 间 创 建 类 似 管道 的 连接 ,其 至 可 以 通过 socket 连接 其 他 主 
机 上 的 进程 (如 图 11.7 所 示 )。 本 节 将 学 习 socket 的 基础 知识 ,理解 如 何 用 socket ERA 
主机 上 的 客户 端 和 服务 嚣 端 ， 其 思想 就 跟 打 电话 查询 当地 时 间 一 样 简单 。 











网络 连接 


1.7 连接 到 远 端的 进程 
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11.5.1 ”类比 :“ 电 话 中 传 来 声音 : 现在 时 间 是 ……” 


许多 城市 都 设 有 提供 时 间 上 服务 的 电话 号 码 。 只 要 拨打 该 号 码 , 机 串 将 负责 告诉 你 
市 的 时 间 。 它 是 如 何 工作 的 呢 ? 如果 想 建立 P NEM, 该 如 何 做 呢 ? 可 以 采用 图 
8 中 所 描述 的 比较 简单 的 方法 。 你 坐 在 办 公 室 里 ,将 一 个 钟 村 在 墙 上 来 扮演 提供 时 间 Lae 
Re ae. Sr RM EAE JEU Unix 中 基于 socket 建立 时 间 服 务 器 的 步骤 完全 一 致 ， 下 面 ， 
EAT HEHE 






b 
一 个 电话 号 


since 
C 










客户 ; 服务 器 : 
pi » 
找到 电话 Sins it 
Wem is na ini 求 
获得 数据 发 送 数 据 
itur Eutr 


图 11.8 ”时间 最 务 


lj， 建 立 服 务 及 与 服务 相关 的 操作 
- 且 天 好 并 安装 了 你 自己 的 时 钟 ,如 何 建 立 和 操作 时 间 服 务 器 呢 ? 
(OD 建立 服务 
建立 服务 包含 以 下 3 个 步骤 。 
^ 获取 一 根 电 话 线 
首先 , 常 要 一 根 毛 自 公 用 电话 网 上 的 电话 线 来 连接 办 公 桌 旁 寺 上 的 插座 。 该 电话 线 和 
插座 使 你 可 以 连接 到 电 活 网 上 , 接 下 来 外 面 的 呼叫 可 以 被 传送 到 你 的 办 公 桌 。 这 里 的 插座 
通常 被 称 为 通信 油 点 (endpoint of communication)。 下 一 次 如 果 需要 在 家 里 安装 电话 线 , 可 
以 向 电话 局 申请 安装 一 个 通信 端点 。 
为 电话 线 申请 号 码 
客户 端 需 要 通过 呼叫 一 个 电话 号 码 连 接 到 你 的 通信 端点 ， 电话 网 络 以 电话 号 码 来 区 分 
每 个 堵 上 的 播 座 。 从 这 个 类 上 比 本 身 考虑 ， 设想 你 是 在 一 个 大 的 商务 系统 中 ,除了 时 间 服 务 以 
外 还 知 提 供 其 他 的 服务 。 因 此 .每 个 插 雍 要 以 电话 导 色 附加 一 一 个 分 机 号 码 来 标识 ， 
例如 : 你 的 号 码 可 能 是 617—999— 1234. DMS Be 8080 ,电话 号 码 标 识 了 你 的 办 公 室 
所 在 的 大 楼 的 号 码 , 扩 展 号 码 S080 标识 了 该 楼 中 拇 个 具体 的 电话 ， 一 个 号 个 来 标 识 大 楼 ,一 
个 分 机 号 码 来 标识 你 的 服务 ,这 是 一 个 重要 的 机 制 。 
> Db BE HE A td Hi idt 
你 可 能 使 用 的 是 无 来 电 显示 的 电话 、 你 的 服务 不 需要 上 述 类 型 的 电话 服务 。 但 必须 通 
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知 电 话 网 络 让 你 的 电话 线 可 以 接收 接 人 上 呼叫。 你 可 以 为 楼 入 呼叫 设置 一 个 瞩 列 ,并 用 一 条 
消息 来 提示 拨打 者 对 你 来 说 他 们 呼叫 的 重要 程度 ,然后 播放 一 段 音 乐 。 在 socket 中 也 使 用 
了 队列 的 思想 ,当然 不 会 播放 音乐 。 

(2) 与 服务 相关 的 操作 

与 时 间 最 务 相 关 的 操作 是 包含 以 下 3 个 步 又 的 一 个 循环 。 

- 等 待 呼叫 

等 待 在 那儿 ,不 做 任何 事情 直到 有 呼叫 进来 。 从 技术 的 角度 讲 , 邮 被 阻塞 在 一 个 呼叫 
上 。 当 一 个 呼叫 进来 ,你 解除 阻塞 并 接收 呼叫 。 

* HERS 

在 这 个 例子 中 ,你 看 一 下 钟 ,然后 通过 电话 线 把 时 间 告 诉 对 方 。 

。 挂 断 

已 经 完成 了 对 该 呼叫 的 工作 , 挂 断 电话 。 

上 述 6 PERS 个 用 来 建立 服务 ,3 个 用 来 对 应 每 个 接 入 呼叫 。 这 6 个 步骤 就 是 对 在 
电话 网 上 运行 时 间 服 务 的 详细 描述 。 

2. 使 用 服务 

客户 端 如 何 使 用 所 提供 的 服务 呢 ? 每 个 客户 端 都 遵循 以 下 4 个 步 又 。 

(1) 获取 一 根 电话 线 

客户 端 同 样 需要 一 个 遂 信 端点 。 客 户 端 还 要 从 电话 网 络 申请 一 个 电话 号 码 。 

(2) 连接 到 具体 号 码 

客户 端 使 用 这 根 电 证 线 向 电话 网 络 请 求 建立 一 个 到 特定 线路 的 连接 。 客 户 端 拨打 大 
楼 的 电话 此 你 办 公 室 的 分 机 ,并 与 其 相连 。 其 中 的 商务 楼 的 号 码 和 分 机 号 码 的 组 合 被 称 
为 服务 的 网 络 地 址 。 从 技术 的 角度 讲 , 徐 务 楼 号 倘 是 主机 地 址 ,分 机 号 码 是 端口 号 或 者 称 
为 端口 。 丰 前面 的 例子 中 ,主机 号 是 617- 一 999- 1234, 端 口 是 8080, 

(3) 使 用 航务 

项 个 通信 端点 5 客户 端的 和 服务 器 端的 ) 现 在 已 经 建立 了 连接 。 任何 一 方 可 以 通过 该 连 
接 向 另外 的 通信 端点 发 送 数 据 。 以 时 间 服 务 器 为 例 , 服 务 器 通过 线路 发 送 数 据 , 而 客户 端 岂 
接收 信息 。 像 目录 编排 这 样 更 加 复杂 的 服务 就 需要 服务 器 和 客户 端 之 问 更 复杂 的 交互 。 本 
Tuc deor VLDE E IHR SS 。 

(4) HERE A 

SEA CTE. A ia LE h. 

3， 重 要 概念 

时 间 服 务 器 例子 包含 了 socket 编程 中 所 要 涉及 的 4 个 重要 的 概念 。 

《1) 客户 和 服务 器 

已 经 不 止 一 次 好 讨论 该 问题 了 。 服 务 器 是 提供 服务 的 程序 。 在 Unix 中 ,服务 器 是 一 个 
程序 不 尾 一 台 计 算 机 。 服 务 峰 进程 等 待 请 求 ,处 理 请 求 ,然后 循环 回去 等 待 下 一 个 请 求 。 客 
户 端 进程 则 不 需要 循环 , 它 只 需 建立 一 个 连接 ,与 服务 器 交换 数据 ,然后 继续 自己 的 工作 。 

(2) 主机 务 和 端口 

运行 于 因特网 上 的 服务 器 其 实 是 某 台 计算 机 上 运行 的 - -个 进程 。 这 里 计算 机 被 称 为 主 
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机 。 机 器 通常 被 指定 一 个 名 宝 如 sales. xyzcorp. com, 这 被 称 为 该 主机 的 名 字 。 服 务 器 在 该 
主机 上 拥有 一 个 端口 。 主 极 和 端口 的 组 会 才 标 识 了 一 个 服务 器 。 

《3) 地 址 族 

你 的 时 间 服 务必 须 拥有 ~- 个 电话 号 码 , 它 还 可 能 有 街道 地 址 和 邮编 ,甚至 可 能 有 经 度 和 
绩 度 或 是 其 他 集合 的 数据 等 属性 。 上 述 等 个 集合 的 数据 都 是 你 的 服务 的 地 址 。 但 是 如 用 经 
疼 和 纬度 来 代替 电话 号 码 中 的 电话 号 码 和 扩展 号 码 的 活 , 它 们 有 可 能 不 能 正常 运作 。 

上 面 的 每 个 地 址 分 别 属于 不 同 的 地 址 族 。 电 话 号 码 和 分 机 号 码 基 电话 网 络 地 址 族 的 地 
址 ,这 里 可 以 用 AF. PHONE 来 标识 。 类 似 地 ,经 度 和 纬度 在 全 球 坐 标 系 统 地 址 族 中 才 有 意 
文 ,并 可 以 用 AF. GLOBAL 来 标识 。 

(4) 协议 

协议 是 服务 器 和 客户 之 间 交 互 的 规则 。 在 时 间 服 务 器 的 例子 中 ,协议 很 简单 : 客户 坚 
叫 ,服务 器 回答 ,给 出 时 间 信 息 后 持 断 。 

如 果 运 行 的 是 一 个 查 号 辅助 服务 ,又 将 如 何 呢 ? 协议 将 会 复杂 一 点 。 服 务 器 需要 同 
答 和 发 送 初 始 欢迎 信息 (例如 :欢迎 访问 查 号 辅助 系统 ,请 问 您 在 哪个 城市 ??)。 客 户 端 
给 出 城市 的 和 名字 后 ,服务 器 将 询问 所 查 名 字 ( 例 旭光 您 需要 查询 什么 ?”)。 客 户 端 以 某 公 
司 或 个 人 的 名 宇 作 应 管 。 这 时 服务 器 给 出 所 要 请 求 的 电话 号 码 或 此 城市 不 存在 所 查询 的 
名 字 的 消息 。 一 些 查 导 辅助 服务 器 还 提供 付费 的 电话 服务 ， 消 息 的 交互 遵循 查 号 辅助 协 
IX (directory - assistance protocol) ,本 章 称 其 为 DAP。 每 个 客户 /服务 器 模型 都 必须 定义 这 
样 一 个 协议 。 


11.5.2 因特网 时 间 、DAP 和 天 气 服 务 器 


时 间 服 务 器 和 查 号 辅助 服务 器 的 例子 不 仅仅 是 用 于 教学 的 比喻 ,它们 在 因特网 中 在 在 
着 广泛 的 应 用 。 试 一 下 下 面 的 命令 : 











$ telnet nit. edu 13 

Trying 18.7.21.69... 

Connected to mit. edu 

Escape character is '^!'. 

Mon Aug 13 22:36,;44 2001 
Conncetion closed by [oreign host. 


$ 


位 于 MIT 的 某 台 主机 上 有 一 台 时 间 服 务 器 , 它 在 13 号 端口 等 待 请 求 。 当 用 telnet MK 
服务 器 连接 的 时 候 , 上 服务 器 接收 请 求 , 检 查 系 统 时 钟 , 通 过 网 络 送 回 当前 的 时 间 , 然 后 挂 断 连 
接 。 上 跟前 商 的 时 间 服 务 的 例子 完全 相同 ,它们 甚至 使 用 了 相同 的 协议 。 试 :下 连接 到 其 化 
主机 的 13 号 端 日 。 可 以 得 到 世界 上 其 他 任何 机 妖 土 的 时 间 。 

telnet 程序 就 像 一 部 电话 。 它 和 和 远 端 主机 的 某 个 端口 建立 连接 ,然后 把 你 键盘 上 的 输入 
数据 通过 连接 发 送出 去 ,并 将 通过 连接 接收 到 的 数据 总 未 在 屏幕 上 。 

那 查 号 辅助 服务 又 如 何 呢 ? 查 号 辅助 服务 器 通常 在 79 号 端口 临 听 。 例 如 ,交互 过 程 如 
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下 所 术 : 
$ telnet princeton, edu 79 
Trying 128.112.128.981... 
Connected to princeton, edu. 


Escape character is '^]'. 


Smith 








alias: 000012345 
name. Waldo Smith 
department. Special Student 
email. waldos(@Princeton. EDV 
emailbox, waldos(@imail, Princeton. EDU 


netid; waldos 











alias; 000333333 
name; Ignatz E Smith 
department. Undergraduate Class vf 1997 
email. ismith(àPrinceton. EDU 
emailbox; ismith@mail. Princeton. EDU 


netid: ismith 


当 一 个 请 求 到 来 时 ,服务 器 接收 该 请 求 。 协 议 中 规定 了 客户 必须 输入 用 户 名 并 以 回 车 
结束 。 服 务 器 将 所 有 的 匹配 人 口传 同 , 然 后 挂 断 连接 。 
天 气 服务 又 是 怎样 呢 ? 试 一 斌 下面 的 命令 


telnet rainmaker. wunderground. com 3000 
该 天 气 服务 的 协议 更 加 复杂 ,不 过 界 商 却 友好 得 多 。 
11.5.3 服务 列表 : 众所周知 的 端口 


如 何 知 道 端口 13 是 时 间 服 务 端口 而 79 是 目录 辅助 服务 蛇 ?” 同 样 的 道理 ,在 美国 每 个 人 
都 知道 号 码 911 是 紧急 服务 ,号码 411 是 查 号 服务 ,这些 就 是 众所周知 的 端口 。 在 文件 /etcy 
services 中 定 尽 了 众所周知 服务 端口 号 的 列表 : 


§ more /etc/services 

H § NetBSD;services, v 1.18 1996/03/26 00,07,58 mrg Exp $ 
+ Network services, Internet style 

+ 

# Note that it is presently the policy of LANA to assign a single 

# well known port number for both TCP and UDP; hence, most entries 
H here have two entries even if the protocol doesn't support UDP 


f operations. 
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# Updateed from RPC 1340, "Assigned Numbers"(July 1992). Not all 


& ports are included, only the more common ones. 


# 
# from; @( 4 ) services 5.8 (Berkeley) 5/9/91 
着 

tcpmux l/tep # TCP port service multiplexer 

echo 7/tep 

echo 7 /udp 

discard 9 ftap sink null 

discard 9/udp sink null 

systat  11/tep users 


datetime 13/tep 
datetime 13/udp 
-— more -- C135) 


从 列表 中 可 以 看 出 时 间 服 务 是 端口 13。 和 仔细 研究 该 文件 可 以 看 到 因特网 主机 上 的 标准 
服务 ,如 ftp,telnet finger f http 的 端口 。 

所 有 这 些 运行 在 因特网 主机 上 的 服务 实际 上 都 是 基于 前 面 给 出 的 时 间 服 务 器 模型 的 思 
AE RIDERS. ix HUP EX ES EH Hu FH Unix 的 系统 调用 ,从 而 编写 自己 的 时 间 服 务 器 以 及 
客户 端 版 本 。 


11.5.4 fW timeserv. c: 时 间 服 务 器 


LMA MET RADARS BR 6 个 步 又。 每 个 步骤 与 一 个 系统 调用 相对 应。 对 
应 关系 如 下 所 示 : 





行 为 系统 调用 

1. 获取 电话 线 il socket 

2. 分 配 号 码 hind 

8. 允许 接 人 调用 listen 

4, 等待 电 话 accepi 

5. 传送 数据 read/write 
6. f£ rH is close 

程序 如 下 : 


/* timeserv.c a socket - based time of day server 


x A 


Ë include < stdio. h> 
# include <unistd.h> 
# include <(sys/types. h> 


# include «Z sys/ socket. hi> 
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# include 
H include <.netdb. h> 
f: include 


<Onetinet/in. h> 


«time. h> 


# include «strings. h> 


#define PORTNUM 13000 
4define HOSTLEN 256 
# define 


/* our time service phone number #/ 


oops Unsg) i perror(msg) ; exit(1) > ! 


int main(int ac, char x av| D 


i 
struct  sockaddr in sadar ; /* build our address here x/ 
struct hostent * hp; /* this is part of our «/ 
char hostname| HOSTLEN ; /x address x/ 
int sock id,sock fd; /* line id, file desc «/ 
FILE * sock fp; /* use socket as stream «/ 
char x ckimeC) ; /* convert secs to string x/ 
time t thetime; j+ the time we report «/ 
ÄR 
x Step 1; ask kernel for a socket 
" 
Sock id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x, 
if ( sock id == -1} 
ocops( "socket" }; 
fe 


* Step 2, bind address to socket. Address is host, port 


xf 


+ 343 ， 


bzero( (void * )&saddr, sizeof(saddr) ); 


gethostname( hostname, HOSTLEN ); 


hp = gethostbyname( hostname ); 


/* clear out struct x/ 


/* where am I ? x/ 


/* get info about host xy 


¿x fill in host part */ 
bcopy( (void * )hp- —h addr, (void * )&saddr.sin_addr, 
hp---h length?; 
Saddr.sin port = htons{PORTNUM) ; 


AF_INET ; 


/* fill in socket port */ 


saddr.sin family - /* fill in addr family */ 


if ( bind(sock id, (struct sockaddr x )&saddr, sizeof(saddr)) |= 0) 
oops( "bind" >; 


; 
ix 


* Step 3: allow incoming calls with Qsize- 1 on socket 
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if ( listen(sock_ id, 1) !- 0) 


oops( "listen" ); 


H * 


* main loop, accept (Ò, write(?, close() 


f 
while ( 1 }{ 
Sock fd = accept(sock id, NULL, NULL); fx wait for call x/ 
printf("Wow! got a call! \n"); 
if (sock fd == -1) 
oops( "accept" 5»; /* error getting calls */ 
sock_fp = fdopen(sock fd, "w"); fx we'll write to the x/ 
if ( sock fp -- NULL) /* socket as a stream «/ 
oops( "fdopen'" ); /* uniess we can't x/ 
thetime = time(NULL); /x get time «/ 
fx and convert to strng x/ 
fprintf( sock fp, "The time here is .. " 5; 
fprintf( sock fp, “$ s", ctime(Sthetime) ); 
fclose( sock fp); ¿+ release connection #/ 
} 


下 面 将 对 程序 如 何 工作 给 出 解释 。 

© 上 和 步骤 1: rn AE EET T socket 

socket 是 一 个 通信 和 端点。 就 像 位 于 圳 上 的 电话 插座 — FR socket 是 产生 呼叫 和 接收 呼叫 
的 地 方 。 系 统 调用 socket 创建 一 个 socket, 



































socket 

目标 建立 -个 socket i 
头 立 忻 include € sys/types, hi 

# include = sys/socket. hi> 
& x m Rl sockid=socket(int domain. int typesint protocol) 
#8 dotnain 通信 域 

PF_INET Hi F Internet socket 

Lype socket HÆR, SOCK_STREAM IRA 36 dpi 

protocol 协议 socker 'P Br FH AQ ERT RUA 0 
3& [8] (Bi el ig Fl ik fo ” i 


sockid TS, HR [2] 





第 11 章 连接 到 近 端 或 远 端 的 进程 : 服务 器 与 Socke (BRS) . 345 * 








socket 油 用 创建 一 个 通信 端点 并 返回 一 个 标识 符 。 有 很 多 种 类 型 的 通信 系统 ,每 个 被 称 
为 一 个 通信 域 。Internet 本 身 就 是 一 个 域 。 在 后 面 会 看 到 Unix 内 核 是 另 一 个 域 。Linux X 
持 好 几 个 其 他 域 的 通信 ， 

socket 的 类 型 指出 了 程序 将 要 使 用 的 数据 流 类 型 。SOCK_STRAEAM 类 型 跟 双 向 的 
管道 类 似 。 数 据 作 为 连续 的 字 节 流 从 一 端 写 人 ,再 从 另 一 端 读 出 。 后 面 的 章节 中 将 介绍 
SOCK DGRAM 类 型 。 

函数 中 最 后 的 参数 protocol 指 的 是 内 核 中 网 络 代码 所 使 用 的 协议 ,并 不 是 客户 端 和 服务 
器 之 间 的 协议 。 一 个 为 0 的 什 代 表 选择 标准 的 协议 。 

* 步骤 2: Be MHL socket 上 ,地 址 包括 主机 .端口 

下 一 个 步 又 是 把 一 个 网 络 地 址 分 配给 socket。 在 Internet BRP, Hiti di EELE i ET fa 
成 。 这 里 不 能 使 用 端口 13 ,因为 该 端口 已 经 为 时 间 骤 务 器 保留 。 这 里 可 使 用 端口 13000 
来 代 赫 。 可 以 为 你 的 服务 器 端口 选择 任意 的 号 码 , 只 是 该 导 友 不 要 太 小 丹 丰 能 已 经 被 占 
用 。 低 端口 号 可 能 已 经 被 系统 服务 所 占用 ,而 不 能 骨 被 普通 用 户 使 用 。 请 检查 系统 中 端 
口 的 限制 范围 。 端 口号 是 一 个 16 位 的 数值 ,所 以 有 很 多 端口 号 可 用 。 系 统 调用 bind 如 下 
BUR. 


bind 

















自 标 绑 定 一 个 地 址 到 socket 
头 文件 # include <Isys/types. h> 
# include « sys/socket, hz 
Ed dE result— bind(int sockid, struct sockaddr * addrp. socklen, t addrlen) 
参数 sockid socket 的 id 


addrp 指向 包含 地 址 结构 的 指针 
addrlen — HE K BE 

.返回 值 eu 遇 到 错误 
0 成 功 








bind 调用 把 一 个 地 址 分 配给 socket。 该 地 址 的 分 配 就 类 似 于 把 一 个 电话 号 和 码 分 配给 二 
上 的 一 个 插座 ; 当 进 程 要 与 服务 器 连接 的 时 候 , 它 们 就 使 用 该 地 址 。 每 个 地 址 族 都 有 自己 的 
格式 。 因 特 网 地 址 族 (AF_INFT? 使 用 主机 和 端口 来 标志 。 地 址 就 是 一 个 以 主机 和 端口 为 成 
员 的 结构 体 。 自 己 写 的 程序 应 首先 初始 化 该 结构 的 成 员 , 然 后 再 填充 基体 的 主机 地 址 和 端 
口 导 ,最 后 填充 地 址 族 。 关 于 建立 上 述 数据 的 基体 函数 ,可 参阅 玫 助 手册 。 

当 所 有 的 部 分 被 填充 了 之 后 ,地址 已 经 被 绑 定 到 该 socket 上 。 其 他 类 型 的 socket 会 使 
用 包含 不 同 成 员 的 地 址 。 

© JEWR 3: 在 socket 上 ,人 允许 搂 人 图 呀 并 设置 队列 长 度 为 1 

服务 器 接收 接 人 的 呼叫 ,所 以 这 里 的 程序 必须 使 用 listen, 
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"人 


























listen 

目标 监听 socket 上 的 连接 
头 文件 4 include — sys/sacker. hi> 
函数 原型 n result=listen€int sockid.int qsize) 
参数 sockid d& lic E S BY socket 

qsize 允许 接 人 连接 的 数目 
返回 值 一 1 BAR 

0 成 功 


listen 请 求 内 核 允 许 指定 的 socket 接收 接 入 呼叫 。 并 不 是 所 用 类 型 的 socket 都 能 接收 
EAE, {E SOCK_STREAM 类 型 是 可 以 的 。 第 二 个 参数 指出 接收 队列 的 长 度 。 在 本 章 
的 程序 中 请 求 的 是 一 个 长 度 为 1 的 队列 。 队 列 最 大 长 度 则 取决 于 具体 socket 的 实现 。 

© ZR 4. 等 待 /接收 呼叫 

— E socket 被 建立 并 被 分 配 一 个 地 址 ,而 且 准 备 等 待 接收 呼出 ,程序 即将 并 始 工 作 ， 服 
务 器 等 待 直 到 呼叫 到 来 。 它 使 用 系统 调用 accept 来 接收 调用 ， 














accept 
目标 接收 socket 上 的 … 个 连接 。 
文件 > ansfude <Isys/types. hz 
# include «sys/socket, h> 
函数 原型 fd — accepttint GE ret socl nd * callerid. socklen_t z addrlenp) 
参数 = sockid 接收 该 socket 上 的 时 时 


callerid 18 m] rf n] He pps TS ET 

addrlenp $f [np ef ni| d Miu £i Fy 1 A B9 38 EF 
返回 值 1 JB EE: 

fd 用 于 读 写 的 文件 描述 符 





accept 阻塞 当前 进程 ,一 直到 指定 socket 上 的 接 人 连接 被 建立 起 来 ,然后 accept 将 返回 
文件 描述 符 , 并 用 该 文件 描述 符 米 进行 读 写 操 作 。 此 文件 重 述 符 实际 上 是 连 到 呼叫 进程 的 
某 个 文件 描述 符 的 一 个 连接 。 

accept 支持 一 种 类 型 的 呼叫 者 的 ID。 在 呼叫 发 起 痢 一 边 ,socket 有 自己 的 地 址 ,例如 对 
于 因特网 连接 ,地 址 就 是 主机 地 址 和 端口 号 。 如 果 callerid 和 addrlenp 指针 不 为 空 的 话 , 内 
核 将 把 呼叫 者 地 址 填 沈 到 callerid 所 指向 的 结构 中 ,并 把 该 结构 的 长 度 填充 到 addrlenp 所 指 
向 的 内 存单 元 中 。 

就 像 人 们 使 用 来 电 显示 的 信息 米 决 定 如 何 妊 理 打 入 的 电话 一 样 ,一 个 网 络 程序 可 以 使 
用 呼叫 进程 的 地 址 米 决定 如 何 处 理 该 连接 。， 

。 步 又 5; 传输 数据 

accept 调用 所 返回 的 文件 描述 符 是 一 个 普通 交 忻 的 描述 符 。 对 它 的 操作 从 第 2 章 中 学 
习 完 open 调用 之 后 一 直 在 使 用 。 程 序 timeserv, c 用 [dopen 将 文件 描述 符 定向 到 缓存 的 数 
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据 流 ,以 便于 使 用 print! 调用 来 进行 输出 。 在 以 前 只 能 使 用 write 来 完成 这 项 工作 . 

> DRG. 关闭 连接 

accept 所 返回 的 文件 描述 符 可 以 由 标准 的 系统 调用 close 关闭 。 当 一 端的 进程 关闭 了 该 
端的 socket, 若 另 一 端的 进程 在 试图 读数 据 的 话 , 它 将 得 到 文件 结束 标记 。 这 跟 管 道 的 工作 
原理 类 似 。 
11.5.5 测试 timeserv. c 

下 面 叮 以 编译 并 运行 时 间 服 务 器 : 

$ cc timeserv.c - otimeserv 

5 timeserw 


29362 
$ 


i BAR SS VAS C” SR, AP shell 将 运行 它 但 不 调用 wait HR. WS 35 EH 3E TE 
accept 调用 上 。 这 里 可 以 用 telnet 连接 到 服务 器 上: 


$ telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character is '^ ''. 

Wow! got a call! 

The time here is .. Tuc Aug 14 11,36,30 2001 
Connection close by foreign host. 

5 

S telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character ig '^ ' 

Wow! got a callt ; 

The time here is .. Tue Aug 14 11,36,53 2001 
Connection close by foreign host. 

$ 


bif 0h) 8 FP BET OP ERE LRS SE Oo TNE, RS SS. RE 
用 kill fg R25 RHE. 
5 kill 29362 


ATF WR 522 D 3 telnet 程序 是 其 客户 . 但 它 并 不 总 是 适 台 连接 到 任何 服务 器 上 的 。 
这 里 将 针对 该 服务 固 编 写 一 个 特殊 的 客户 端 程序 。 


11.5.6 编写 timeclnt.c: 时 间 服 务 客户 端 
基于 电话 的 时 间 服 务 客户 端的 实现 包含 4 个 步骤 ,每 个 步骤 对 应 于 一 个 系统 调用 ， 


+ 348 « Unix/Linux 编程 实践 教程 











行 为 系统 调用 
E l. 获取 一 根 电 话 线 i | socket 
2. WEY ARS BS connect 
3. 传送 数据 read/write 
4, 挂 断 电话 close 





下 而 是 这 个 程序 ; 


/* timeclnt.c - aclient for tímeserv.c 
* usage, timeclnt hostname portnumber 


af 


# include  «stdio. h> 

. dinclude <Usys/types. hi> 
# include <‘sys/socket. h> 
# include  «netinet/in. h 


# include  «netdb.h-— 
+ define oopsiímsq) i perror(msg); exit(1); } 


main(int ac, char *av[]) 


1 


struct sockaddr in servadd; /* the number to call «/ 

struct hostent * hp; /* used to get number x/ 

int SOck id, sock fd; /* the socket and fd x/ 

cher  message[| BUFSIZ]: /* to receive message x/ 

int | messlen; /* for message length »/ 
fx 


* Step 1; Get a socket 


xf 


sack_id = socket( AF_INET, SOCK STREAM, 0); /* get a line x/ 
if ( sock id == -1) 


oops( "socket" ); /* or fail x/ 


/* 
* Step 2 : connect to server 
* need to build address (host,port) of server first 


xf 


bzero( &servadd, sizeof( servadd ) ); /* zero the address »/ 


hp = gethostbyname( av[1] ) ， /* lookup hosts ip 4 x/ 
if (hp == NULL) 
cops(av| 1]5; /* or die x/ 


bcopy(hp - —h addr, (struct sockaddr * )&servadd. sin addr, 
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- ~h length); 


servadd. sin port = htons(atoi(av|2 )); /* fill in port number x/ 


servadd.sin family = AF INET ; /* fill in socket type »/ 


/* now dial */ 


if ( connect(sock id,(struct sockaddr x }&servadd, 


rt y- 


sizeof(servadd)) | = 0} 


oops "connect" ); 


* Step 3, transfer data from server, then hangup 


*/ 
messlen = read(sock id, message, BUFSIZ); /* read stuff »/ 
if ( messlen == 19 
oops("read") ; 
if ( write( 1, message, messlen ) | = messlen ) /* and write to «/ 


popsi "write" ); 


/* stdout x/ 


close( sock id ); 


j 


T o EF o E. 

© PRL: 向 内 核 清 求 建立 socket 

客户 端 需要 一 个 socket 跟 网 络 可 连 , 就 像 时 河上 服务 中 的 客户 端 需要 一 条 电话 线 限 电话 
网 络 相 连 一 样 。 客 户 端 必须 建立 Internet 域 (AF_INET)socket, 并且 它 还 必须 是 流 socket 
(SUCK_STREAM), 

* 步骤 2. 与 服务 器 相连 

客户 庙 需 要 连接 到 时 间 服 务 器 。connect 系统 调用 的 作用 实际 上 与 打 电 话 类 似 。 
































counect 
Bim 连接 到 socket 
UA # include «syss types. h> 
# include =< sys/socket, h> 
eR x Ru result — connectCint sockid, struct sockaddr * serv, addrp, socklen t addrien) ; 
参数 sockid 用 于 建立 连接 的 socket =. 
serv_addrp {EMIRA BA A PT 
addrlen 结构 的 长 度 
返回 值 =l B gl gr UR 
00 成 功 





connect al FH GRAS sockid 所 标识 的 socket 和 由 serv_addrp 所 指向 的 socket HHH 4B 
连接 。 如 果 连 接 成 功 的 话 ,connect 返回 0。 而 此 时 ,sockid 是 一 个 合法 的 文件 措 述 符 , 可 以 
用 来 进行 读 写 操作 。 写 人 该 文件 描述 符 的 数据 被 发 送 到 连接 的 另 一 端的 socket, 而 从 男 一 端 
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写 人 的 数据 将 从 该 文件 描述 符 读 取 、 

。 步 又 3 和 4: 传送 数据 和 挂 断 

在 成 功 连接 之 后 ,进程 可 以 从 该 文件 描述 符 读 写 数据 ,就 像 与 普通 的 文件 或 管道 相连 接 
一 样 。 在 时 间 服 务 的 客户 /服务 器 例子 中 ,rimeclnt 只 是 从 服务 器 谈 取 一 行 数据 。 

该 取 时 间 之 后 ,客户 端 关 闭 文件 描述 符 然 后 退出 。 若 客户 映 退 出 而 不 关闭 描述 符 ,内 核 
将 完成 关闭 文件 描述 符 的 任务 。 


11.5.7 测试 timecint. c 


大 家 已 经 有 好 几 页 没有 看 到 插图 了 .大 概 已 经 记 记 这 些 代 码 的 任务 了 吧 . 图 11.9 将 
会 提醒 我 们 。 有 上 服务 器 进程 运行 在 一 台 机 器 上 ,而 客户 端 程序 在 另 一 台 机 器 上 通过 网 络 与 
服务 器 连接 。 WA LL write 调用 来 发 送 数据 ,客户 端 通过 read 调用 来 接收 消息 。 


客户 服务 器 








图 11.9 位 于 不 同 机 器 上 的 进程 


对 上 上面 这 段 代 码 真实 的 调试 需要 在 不 同 机 器 上 运行 这 两 个 程序 .我 不 太 确 定 下 面 写 在 
书 上 的 测试 情况 是 否 足 够 明确 ,不 过 大 家 可 以 作为 参考 . 


$ hostname # 检 查 当 前 机 器 

computer]. mysite. net # 第 一 台 机 器 

5 cc timeserv.c - o timeserv 井 建立 服务 器 

5 , /timegervE5 t#GHE 

[1] 10739 

$ 

$ scp timeclnt, c bruce(Z computer2, EAE PRAES — éH 
bruce@computer2’s password, 

timeclnt.c | IRB | 1. 8KB/s IETA: 00,00,00 [100 & 


$ ssh brnce@computer2 

bruce(ücomputer2's password, 

No mail. 

computer2.bruces cc timeclnt.c - o timeclnt 

computer2; bruce $./timeolnt computer? 13000 How! Got a call! 
The time here is ..Tue Aug 14 02,44,31 2001 


computer? ; bruces 
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服务 器 编译 好 后 ,运行 在 机 器 1 上 . 然后 把 客户 端 程序 复制 到 机 器 2 上 ,再 登录 到 机 器 
2。 在 机 器 2 上 ,编译 好 客户 端 后 ,然后 让 客户 端 请 求 与 运行 在 机 器 1 上 监听 在 13 000 端口 
的 服务 器 相连 接 。 这 里 和 大 到 的 消息 就 是 从 机 器 1 上 的 服务 器 通过 网 络 发 送 给 机 器 2 上 的 客 
Pj. mx pP gH gx m. 

从 上 面 的 测试 结果 是 否 能 真 的 看 到 机 器 2 上 的 输出 ? 我 是 从 机 器 1 连接 到 机 器 2 的 ,所 
以 显示 消息 的 终端 实际 上 是 连接 到 机 器 ) 上 的 。 后 面 的 一 些 练习 会 让 你 仔细 考虑 其 运作 
原理 。 

通过 timeserv/timeclnt 程序 ,可 以 得 到 另 一 台 机 器 上 的 时 间 . HABA AE MOT 
间 可 以 保证 不 间 机 器 的 时 钟 同 步 。 网 络 上 的 某 台 机 器 可 以 作为 权威 时 间 服 务 器 ,而 其 他 的 
饥 器 可 以 利用 上 面 的 程序 周期 性 地 来 调整 自己 的 时 名 。 


11.5.8 另 一 种 服务 器 : 远程 的 ls 


下 一 个 项 目 是 编写 一 个 可 以 打印 远 端 机 器 上 文件 列表 的 程序 。 你 可 能 在 两 台 机 器 上 拥 
有 账号 。 若 想 看 另 一 台 册 器 上 的 文件 列表 时 和 如何 去 做 呢 ? OS RA BBL Re 
运行 lg。 一 个 侠 速 的 且 更 吉方 便 的 途径 是 运行 一 个 远程 的 is 程序 ,这 里 称 它 为 rls(Cremote 
ls)。 可 以 指定 主机 名 积 目录 ， 


S rls computer2. gito. net /home/me/code 


当然 ,rls 需要 在 另 一 台 机 器 上 的 一 个 服务 进程 接收 请求 ,处 理 请 求 和 返回 结果 。 该 系统 
看 上 去 类 似 于 图 11. 10。 服 务 器 运行 在 一 台 机 器 上 ,客户 运行 在 另 一 台 机 器 上 并 与 服务 器 连 
接 , 把 日 录 的 名 字 发 送 给 服务 器 。 服务 器 将 位 于 该 目录 下 的 文件 列表 信息 返回 给 客户 端 ， 
客户 端 将 结果 送 至 标准 笨 出 把 它们 显示 出 来 . 两 进程 系 统 提 供 了 对 于 不 同 机 器 上 的 目录 访 
问 的 支持 。 


客户 服务 器 








fase 
图 1).10 一 个 远 端 的 1s 系统 
l|. 设计 远程 ls 系统 
这 里 需要 3 个 要 素来 实现 rls KH: 
(1) 协议 
(2) 客户 端 程序 
(OD 服务 器 端 程序 
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2. Vix 

HRASHARA SE. Be. 客户 端 发 送 一 行 包含 有 目录 名 称 的 请 求 。 服 务 右 读 取 
该 目录 名 之 后 打开 并 读 取 该 目录 ,然后 把 交 件 列表 发 送 到 客户 端 。 客 户 端 循环 地 读 到 文件 
PN Ze HARS da FEE BE PE PS 

3. 客户 端 程序 , rls 


/* rls.c — a client for a remote directory listing service 





* usage, rls hostname directory 
xf 

# include <(stdio. h> 
sinclude — «Lsys/types. h> 
# include — «2sys/socket.h^- 
f include  -netinet/in,. hi> 


1 F include — -—netdb. ho 


# define cops(msq) { perror(msg); exit(1); } 
# define PORTNUM 15000 


main(int ac, char * avi _) 


i 


struct sockaddr_in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number « / 
int . sock id, sock fd; /* the socket and fd xy 

char  buffcr[BUFSIZ ; /* to receive message +/ 
int — n read; /* for message length x/ 


if Cac t= 3) exit); 


/** Step 1; Get a socket * «/ 


SOCk id = socket( AF INET, SOCK STREAM, 0 }; fs geta line «/ 
if (sock id == -1) 
oops( "socket" 5; /* or fail «/ 


/** Step 2; connect Lo sezver x x/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address »/ 
hp = gethostbyname( av[1]); /* lookup host's ip # x/ 
if (hp == NULL) 

cops(av[ 1]? ; /* or die xy 


bcopy(Chp- —h addr, (struct sockaddr + J&servadd. Sin addr, hp- —h length); 


servadd.sin port = htons(PORTNUM); /* fill in port number */ 
servadd.sin family = AF INET ; /* fill in socket type «/ 
if ( connect(sock id,(struct sockaddr * )&servadd, sizeof(servadd)) | = 0) 


oops( "connect" ), 


/* x* Step 3, send directory name, then read back results * «/ 


ll 连接 到 近 端 或 远 端的 进程 , 服务 器 与 Sok (SEF) 
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iE C write(sock 1d, av[2], strlentav[2]))) == -1) 


oops("write"); 


if ( urite(sock id, "\n", D == -1) 


cops(" write"); 


while( (n read = read(sock id, buffer, BUFSIZ)) > 0) 


if ( write(), buffer, n read) == -1) 


cops( "write"); 


close( sock id); 


} 


注意 该 客户 端 与 时 间 服 务 客户 端的 不 同 之 处 。rls 客户 端 首先 把 目录 名 写 到 socket P, 
上 面 的 协议 规定 了 答 户 端 每 次 发 送 一 行 , 因 此 径 序 中 在 行 尾 增加 一 个 换行 符 。 接 下 来 ,客户 
端 进 人 一 个 循环 ,将 从 socket 所 接收 的 数据 复制 到 标准 输出 .直到 接收 到 文件 结尾 标志 。 
ris. c 使 用 低级 别 的 write 和 read 调用 来 和 服务 器 交换 数据 ， 循环 中 用 到 了 标准 大 小 的 缓存 


以 提高 效率 。 下 面 将 编写 服务 器 端的 程序 。 
4. 服务 器 程序 ; rlsd 


服务 器 必须 得 到 一 个 sockel ,然后 调用 bind, listen 
叫 。 在 接收 呼叫 之 后 ,服务 器 从 socke 读 取 目录 名 ,然后 列 出 该 目录 下 的 内 容 。 服 务 器 是 如 
何 给 出 文件 列表 的 呢 ? 这 里 可 以 把 第 3 RSW ls 程序 复制 过 来 ,但 也 可 以 用 一 个 更 简单 的 


方法 : 仅仅 使 用 popen 读 取 常规 版 本 的 1s 程序 的 输出 ,如 图 11. 11 所 示 。 


ma 服务 器 








x a 
—— 
——— 





ls 篇 出 
11.11. 使 用 pepsn"ls" 来 显示 远 端 自 录 


下 面 的 代码 中 使 用 了 popen: 


/* rlsd.c — a remote ls server 一 with paranoia 


¥/ 

# include 
H include 
# include 
# include 
# include 


<istdio. h> 
<unistd.h> 
<sys/types.h> 
<sys/socket. h> 
<netinet/in, h> 


4 ,最 后 着用 accept 来 接收 一 次 呼 
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# include <(netdb. h> 
# inelade «time. h> 


# include «strings. hz» 


# define PORTNUM 15000 /* our remote ls server port */ 
# define HOSTLEN 256 
# define  oops(msg) { perror(msg) ; exit(1) ; ! 


int main(int ac, char * av[ D 


1 
struct  sockaddr in | saddr; /* build our address here x/ 
struct  hostent * hp; /* this is part of our x/ 
char hostname[ HOSTLEN |; /* address */ 
int Sock id,sock fd; /* line id, file desc x/ 
FILE * sock fpi, * sock fpo; | /* streams for in and out #/ 
FILE * pipe fp; /* use popen to run 1s «/ 
char dirname! BUFSTZ |; /x from client +/ 
char command( BUFSIZ]; /* for popen() «/ 
int dirlen, c; 


/** Step 1, ask kernel for a socket x x/ 


sock id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x/ 
if (sock id == -13 


oops( "socket" 5; 


/** Step 2, bind address to socket. Address is host,port * x/ 


bzero( (void «* )&saddr, sizeof(saddr) ); /* clear out struct «/ 
gethostname( hostname, HOSTLEN ); /* where am I ? */ 

bp = gethostbyname( hostname ); /* get info about host */ 
beopy( (void *)hp- >h addr, (void » )&saddr.sin addr, hp- 7h length); 
Saddr, sin port = htons(PORTNUM); /* fill in socket port x/ 
saddr.sin family - AF INET ; /* fill in addr family x/ 


if ( bind(sock id, (struct sockaddr + )&saddr, sizeot(saddr)) I= 0) 
cops( "bind" )- 


/*x* Step 3; allow incoming calls with Qsize = 1 on socket x */ 


if ( listen(sock id, 1) |= 0) 


oops( "listen" ); 


fx 
* main loop: accept(), write(), close() 


; 


*j 


while € 1 }{ 
sock fd = accept(sock id, NULL, NULL); /* wait for call »/ 
if ( sock fd == 一 1 ) 
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-m 一 一 一 一 一 一 -一 --… 一 一 一 . 











Dopsf “accept") ; 
/* open reading direction as buffered stream »/ 
ift (sock fpi = fdopen(sock fd,"r')) == NULL) 


oopst "fdopen reading"); 


if ( fgets(dirname, BUFSIZ- 5, sock fpi) == NULL ) 
oops( "reading dirname") ; 


sanitize(dirname); 


/* open writing direction as buffered stream x/ 
if ( (suck fpo = fdopen(sock fd,"w")) == NULL) 


oops("fdopen writing"): 


sprintf(command, "ls $s", dirname); 
if ( (pipe fp = popen(command, "r")) == NULL? 


oops("popen") ; 


/* transfer data from ls to socket */ 
while( (c = getc(pipe fp)) f= EOF ) 
putc(c, sock fpo); 
pclose(pipe, fp); 
fclose(sock fpo); 
fcloseí(sock fpi); 


! 


sanitize(char * str} 
fu 
* it would be very bad if someone passed us an dirname ] ike 


RU 


; rm * "and we naively created a command “ls ; rm * " 
x* 
* s0.. we remove everything but slashes and alphanumerics 
* There are nicer solutions, see exercises 
*/ 

{ 


char * src, * dest; 


for ( src = dest = str; *sre; srett ) 
if ( + src == '/' |} isalnum( * sre) ) 
xdestt+t+ = x sre; 


* dest = MO, 


注意 服务 器 程序 使 用 标准 缓存 流 来 读 写 数据 。 服 务 器 用 fgets 调用 从 客户 端 读 取 目 录 
名 。 在 调用 popen 后 ,服务 内 就 像 复 制 文件 一 样 地 使 用 gete 和 pute 来 传输 数据 。 当 然 , 服 务 
器 实际 上 荐 从 本 机 上 的 进程 向 另 一 台 机 器 上 的 进程 复制 数据 。 
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注意 sanitize 两 数 的 使 用 。 对 于 任何 运行 参数 中 所 含 的 命令 或 从 因特网 上 获取 数据 的 
服务 器 ,在 编写 的 时 候 都 要 格外 小 心 。 程 序 中 的 服务 器 等 待 接收 来 自 客户 端的 月 录 名 ,然后 
把 它 追 加 到 ls HOME. PRM, RA AE bin”, 服务器 将 创建 并 运行 “1 / 
bin” 命 令 。 这 是 正确 无 误 的 。 但 是 ,如 果 有 人 发 送 字符 串 “， rm « ”给 服务 器 ,服务 器 将 创建 
并 运行 “ls ; rm * "f T. 

为 了 减少 被 玻 坏 的 风险 ,程序 中 必须 确保 接收 的 字符 串 没 有 洲 出 输入 缓存 ;也 没有 游 出 
给 命令 设置 的 缓存 并 且 接 收 的 和 且 录 名 中 不 允许 出 现 非法 字符 。popen 系统 调用 对 于 编写 网 
络 服务 来 说 是 很 危险 的 ,内 为 它 直 接 把 一 行 字符 串 传 给 shell。 在 网 络 程序 中 ,将 字符 串 传 给 
shell 是 一 个 非常 错误 的 想法 。 举 这 个 例子 的 日 的 有 两 个 首先 ,展现 popen 的 另 一 种 用 法 ; 
其 次 则 是 警告 大 家 其 危险 性 ,在 使 用 的 时 候 务 必 小 心 1 


11.6 软件 精灵 


像 很 多 Unix 程序 一 样 ,Unix 服务 器 程序 有 短小 .简洁 的 名 字 。 很 多 服务 器 程序 都 是 以 
d 结尾 ,如 httpd, inetd, syslogd 和 atd, REH d 表示 精灵 (daemon) 的 意思 ,因而 如 名 叫 
syslogd 的 服务 器 程序 实际 上 是 系统 日 志 精 灵 (system log daemon)。 精 灵 就 是 一 个 为 他 人 
提供 服务 的 帮助 者 , 它 随 时 等 待 去 帮助 别人 。 在 你 的 系统 中 ,输入 命令 ps -el 或 ps -ax 就 
可 以 看 到 以 字符 dd 结尾 的 进程 然后 ,可 以 去 阅读 这 些 命令 的 帮助 信息 ,从 商 可 以 更 加 深入 
地 理解 Unix 中 用 容 户 /服务 器 模型 是 如 何 来 处 理 … 些 基础 操作 的 。 

大 部 分 精 灾 进程 都 是 在 系统 启动 后 就 处 于 运行 状态 了 。 位 于 类 似 于 /etc/re. d? 目录 中 
的 shell 脚本 在 后 台 启 动 了 这 些 服务 ,它们 的 运行 与 终端 相 分 离 ,时 刻 准 备 提供 数据 或 服务 。 


小 2h 


1， 主 要 内 容 

。 一 些 程序 被 作为 单独 的 进程 建立 起 来 来 接收 和 发 送 数 据 ， 在 客户 /服务 器 模型 中 , 服 
务 器 进程 为 客户 进程 提供 处 理 或 数据 服务 。 

客户 /服务 器 系统 包含 通信 系统 和 协议 。 客 户 和 服务 器 通过 管道 或 socket 进行 通信 。 
协议 是 会 活 过 程 中 一 系列 规则 的 集合 。 

popen 库 函 数 可 以 将 任何 shell 程序 媒人 入 服务 器 程序 并 有 旦 让 对 服务 器 的 访问 就 像 访 
问 缓 存 文件 一 样 。 

符 道 是 -一 对 相连 接 的 文件 描述 符 。socket 是 一 个 未 连接 的 通信 端点 ,也 是 一 个 潜在 
的 文件 描述 符 。 客 户 进程 道 过 把 自己 的 socket 和 服务 器 端的 socket 相连 来 创建 一 
个 通信 连接 。 

sockets 之 间 的 连接 可 以 扩展 到 另 一 台 机 器 上 。 每 个 socket 以 机 器 地 址 和 端口 来 
标识 。 





D NH RIXA RET Unix 的 版 本 。 
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+ 到 管道 和 socket 的 连接 使 用 文件 描述 符 。 文 件 描述 符 为 程序 提供 了 与 文件 设备 和 
其 他 的 进程 通信 的 统一 编程 接口 。 
2. 下 一 步 的 工作 


本 章 学 


习 了 客户 /服务 器 模型 编程 的 设计 和 两 种 连接 进程 的 方法 ; 管道 和 socket。 在 下 


一 章 中 ;将 集中 精力 学 习 客 户 /服务 器 模型 编程 的 设计 原理 ,并 编写 更 加 复杂 的 程序 。 特 别 
地 ,下 一 章 将 把 对 socket 编程 和 文件 系统 及 进程 控制 的 知识 相 结 合 来 编写 一 个 Web 服务 器 


程序 。 


3. 习题 


11.1 


11.3 


11.4 


11.5 


如 果 你 经 营 的 是 一 家 比萨 饼 外 卖 店 而 不 是 时 间或 查 呈 辅助 服务 的 话 , 结 果 将 如 
何 ? 协议 将 更 加 复杂 。 为 送 外 卖 服务 描述 在 服务 器 和 客户 之 间 传 送 的 消息 序 
列 。 注 意 该 协议 包含 有 一 个 怎 环 ,以 便 多 许 客 户 增加 定购 项 。 


本 章 中 的 popen 版 本 没有 对 信和 号 做 任何 处 理 , 这 是 不 是 正确 ? 子 进程 从 父 进程 那 
里 继 淹 了 信和 叶 处 理 的 设置 。 在 考虑 以 下 三 种 情况 如 何 对 父 进 程 信 号 进行 处 理 之 
后 ;回答 该 问题 ; 终止 .忽略 以 及 调用 函数 。 


在 时 间 服 务 器 和 客户 端 运 行 的 例子 中 ,使 用 了 ssh 命令 从 机 器 1 登录 到 机 器 2。 
此 时 仍 登 录 在 机 器 1 上 ,但 是 在 机 器 2 上 却 运行 了 一 个 shel 进程 。 该 shell 程序 
编译 并 运行 了 时 间 服 务 客户 端 。 

我 的 终端 确实 是 连接 到 机 器 上 了 。 重 新 画图 11. 11 ,使 得 该 图 包含 机 器 1 上 的 
shell @L# 2 下 的 shell .终端 以 及 从 timecint 到 终端 正确 的 数据 流 。 这 可 是 一 个 
AR 25/83 28 A LR. 


Ri fd RG 3€ 8 PY VA eB RE OC A A AE EC a HEY OE HE (JE P k 
盘 文 件 的 连接 与 到 设备 文件 的 连接 具有 完全 不 同 的 属性 集 。 那 么 socket 具有 什 
人 么 样 的 属性 呢 ? ÆR setsockopt 的 帮助 手册 以 获取 更 详细 的 信息 。 


远 端 目录 服务 运行 了 ls 命令 。 当 1s 发生 错误 的 时 候 , 将 会 发 生 什 么 事情 呢 ” Bl 
如 ,指定 的 日 录 不 存在 或 对 于 服务 器 而 言 不 可 读 , 那 么 对 ls 所 产生 的 错误 信息 如 
UAE? 可 以 考虑 两 种 处 理 来 自 ds 的 错误 信息 的 方法 。 首 先 , 如何 把 错误 信 
BRB So? 其 次 ,如 何 把 错误 信息 存放 到 日 志 中 并 通知 用 户 ? 


4. 编程 练习 


11.6 


11.7 


给 tinybe 程序 增加 一 e 选 项。 一 旦 增加 了 该 选项 ,下 面 的 命令 将 能 够 工作 ， 
printf "2 + 2\n4 « 4\n"|tinybe - c|dc 
为 你 的 shell 增加 一 选项。 需要 改变 什么 呢 ? 


编写 pelose 程序 。 该 函数 以 popen 返回 的 FILE * 作为 参数 。fdopen RRA 
存 和 短 记 信息 分 配 了 内 存 空间 。fclose 隔 数 释放 该 内 存 并 关闭 交 件 描述 符 。 那 
A pelose W 4 He {7 AE? 若 另 一 个 子 进 释 死 在 popen 和 pelose 调用 之 问 ， 
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il.10 


11.11 


11. 1Z 


结果 又 将 会 怎样 ? 
本 音 中 的 时 间 服 和 荔 器 并 没有 用 到 系统 调 内 accepi 所 提供 的 调用 者 ID 的 特性 ， 
dE timeserv. c; 使 得 它 在 接收 到 请 求 时 可 以 打印 出 如 Got a call from 123. 123. 


123. 123 (computer2. mysite, net}, 


可 以 阅读 帮助 手册 和 头 文 件 来 了 解 该 工程 中 所 需要 的 函数 和 结构 体 . 


写 一 个 程序 将 sort (EAP RUF IAAL. PLP RS HAOR. TRR FA PRH 
p. Sea OP a EUG BP ER RIE T; sort. XB xL — 7 TER TE 
输入 序列 发 送 给 sort HRA, ERA AIA. HRT BOB PERO sort 89 6r 
出 .再 把 结果 存 加 数组 中 ,并 打印 该 数组 。 


基于 System V 的 Unix 版 本 提供 了 对 双向 管道 的 支持 。 通 过 运行 下 面 的 程序 ， 
可 以 测试 某 个 版 本 的 Unix 是 耕 支 持 双 疝 管道 ; 
P testbpd.c - test bidirectional pipes 


2 
*j 


maini } 
int p|2]; 
if ( pipe(p) 77 - 1) exit(1); 
if ( write(p[0;, "hello", 5) == -1) 


perror("write into pipe[ 0] failed"); 
else 
printf("write into pipe[0 | workedXn") ; 
D 
TAR Rote id BOR PIA ACRI. 一 个 从 pipeL0] 到 pipeL1], 另 一 个 则 方向 相反 。 
身 管道 的 一 端 写 数 据 操作 会 把 数据 放 人 到 通 向 另 一 端的 队列 中 ,而 从 管道 的 一 
问 读 数据 则 将 数据 从 那 况 取出 并 送 入 本 端的 队列 中 ， 
如 果 你 的 系统 不 支持 双向 管道 ,可 以 生成 如 下 调用 : 
# include <i sys/types, h> 
# include < sys/ socket. hl- 
int apipe[ 2; /* a pipe x/ 
socketpair(AF_UNTX, SOCK STREAM, PF UNSPEC, apipe); 


重新 编制 程序 tinybe. c, 使 它 使 用 一 个 双向 管道 而 不 是 使 用 两 个 单 向 的 管道 。 


更改 timeserv.¢ 程序 ,使 得 它 只 响应 来 自 特 定 IP ERMA AR de dE 
收 有 星川 并 检查 客户 端 地 年 。 如 果 客 户 端 地址 不 是 特定 的 下 , 则 服务 器 挂 断 , 否 
则 ,服务 器 将 时 间 返 回 。 

增强 该 电 寨 特征 使 服务 器 可 以 从 文件 中 读 取 所 能 接收 的 IP 地 址 列表 。 描 述 该 
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技术 的 一 些 实际 应 用 。 


大 家 知道 在 服务 器 端 使 用 popen 调用 是 非常 危险 的 。 有 两 种 方法 来 解决 该 问 
题 。 第 一 种 方法 是 编写 一 个 更 加 灵活 ,但 非常 安全 的 sanitize 函数 。 例 如 ,目录 
名 中 人 允许 含有 逗号 .和 破 折 号 .空格 和 其 他 字符 。 并 及 上 月 录 名 中 还 可 以 含有 星 号 
和 分 号 ,这 个 处 理 可 以 像 shell 一 样 ,给 这 些 字符 赋予 特定 的 含义 。 写 一 个 于 加 
有 用 的 ,但 是 安全 的 字符 趾 解 析 两 数 。 

另外 一 种 方 活 是 放弃 使 用 popen ,用 fork, exec 和 dup Steg 4x. 用 这 种 方法 来 重 
写 rlsd.ec 程 序 。 其 中 需要 用 到 wait? 为 什么 ? 


编写 一- 个 位 于 端口 79 的 目录 辅助 服务 器 (finger 服务 器 ) 。 服 务 器 接收 单行 的 
用 户 名 输入 ,然后 给 客 广 端 发 送 一 个 列表 ,其 中 包含 与 输入 此 配 欧 所 有 用 户 。 


代理 (proxy) 指 的 感 接收 请 求 , 把 该 请 求 转发 给 其 他 的 服务 器 ,然后 再 将 从 服务 
器 中 传 问 的 结果 返回 给 程序 。 这 就 类 伏 于 干洗 店 的 前 台 : 它 不 做 清洁 工作 ,只 
是 把 衣服 传送 到 洗衣 设备 或 从 洗衣 设备 取 衣 服 。 

编写 一 个 时 间 报 务 器 代理 。 你 的 程序 应 当 可 以 接收 标准 端 操 上 的 连接 。 为 了 
处 理 该 连接 ,程序 需要 和 真 的 时 间 服 务 建立 连接 ,从 该 服务 器 取得 时 间 ,然后 把 
时 间 转 发 给 客户 端 。 


考虑 上 一 题 中 的 关于 代理 服务 器 的 概念 。 时 间 只 是 每 秒 钟 改 变 一 次 :如 果 你 的 
代理 服务 天 在 几 毫 秒 中 接收 了 很 多 请 求 , 就 根本 不 可 能 在 这 么 短 的 时 间 内 向 时 
间 有 最 务 器 发 送 许 多 请 求 。 编 写 一 个 时 间 代 理 服 务 器 ,可 以 缓存 从 时 间 服 务 器 读 
取 的 时 间 , 只 有 在 新 的 呼叫 超过 了 1 秒 芍 间隔 之 后 才 去 向 时 间 服 务 器 发 送 请 求 
(参见 gettimeofday) , 


D FAR TA A ERE Pe Te a it IR] B Sp PAK. IHE finger 
AR ah PRB A NA MERA., dU s Hos S BE AR aS HE 
其 可 以 缓存 用 户 信息 。 

缓存 时 间 服 务 回 中 所 缓存 的 每 个 元 素 都 有 和 白 然 的 生命 周期 (1 秒 钟 ) ,但 是 在 组 
存 的 目录 辅助 服务 器 中 如 何 决定 用 户 信息 的 保存 时 间 呢 ? 


有 些 面 包 店 有 一 台 给 客户 分 发 编号 的 机 器 。 柜 台 上 写 着 “正在 服务 ”的 牌子 上 
显示 了 下 一 个 顾客 的 编号 。 设 计 一 个 客户 /服务 器 程序 来 实现 面包 数字 服务 器 
系统 。 服 务 器 产生 连续 编号 。 用 户 运 行 客户 端 程序 来 获取 服务 器 端的 数字 。 


每 个 C 程序 员 都 知道 argv[0] 通 常 表示 正在 运行 的 程序 名 称 。 有 一 种 比较 接近 
的 方法 可 以 使 一 个 进程 获得 自己 的 和 名字。 程序 可 以 使 用 popen, 然后 从 ps 命令 
的 输出 中 来 搜索 自己 的 进程 ID。 编 写 一 个 使 用 该 方法 的 程序 。 
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概念 与 技巧 

* WS arm socket. 目的 和 构造 

* EP socket. 目的 和 构造 

”客户 /服务 器 协议 

* BRA BIZ: 使 用 fork 来 接收 多 个 请 求 
。 48 (zombie) [8] Zt 

* HTTP 


12.1 服务 器 设计 重点 


使 用 万 维 网 是 容易 的 ,只 要 在 浏览 器 中 输入 一 个 网 址 或 者 单 击 一 个 超 链 , 虐 务 器 就 会 把 
相应 的 网 页 发 送 过 来 。 但是 Web 是 怎样 工作 的 ? 从 Web 服务 器 上 获取 网 页 和 从 时 间 服 务 
器 获取 时 间 是 类 似 的 吗 ? 

基于 socket 的 客户 /服务 器 系统 大 多 是 类 似 的 。 虽 然 电 子 邮 件 . 文 件 传输 .远程 登录 利 
分 布 式 数据 库 ,以 及 其 他 的 Internet 服务 在 屏幕 上 显示 的 内 容 相 异 , 和 但 是 它们 的 运作 原理 是 
一 致 的 。 

一 旦 理解 了 一 个 socket 流 的 客户 /服务 器 系统 ,就 可 以 理解 大 多 数 其 他 的 系统 。 在 本 章 
中 ,将 学 习 网 络 编程 的 基本 操作 和 设计 原则 ,然后 使 用 它们 来 建立 一 个 Web 服务 器 。 


12.2 三 个 主要 操作 


在 第 11 章 看 到 的 基于 socket 流 的 客户 "服务 器 系统 与 图 12. ] 看 上 去 类 似 。 客 户 和 服 
务 器 都 是 进程 。 服 务 器 设立 服务 ,然后 进 人 循环 接收 和 处 理 请 求 。 客户 连 接 到 服务 器 ,然后 
发 送 .接受 或 者 交换 数据 ,最 后 退出 。 该 交互 过 程 中 主要 包含 了 以 下 3 个 操作 : 

(1) 服务 器 设立 服务 。 

(2) 客户 连接 到 服务 器 。 

(3) 服务 器 和 客户 处 理事 务 。 
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AP: 服务 器 : 

设立 服务 
EXSUNXR ---------------- > ”接收 请 求 
HRK 提供 服务 | 
Hal fi Be HEREJES 


图 12,1 SPIRE HERIR 


下 面 将 分 别 讨 论 每 个 操作 ， 


12.3 操作 1 和 操作 2: 建立 连接 


基于 流 的 系统 需要 建立 连 妨 。 这 里 将 回顾 一 下 建立 连接 的 步骤 ,然后 将 这 些 步 又 抽象 
成 一 些 库 函 数 。 


12.3.1 操作 1: 建立 服务 器 端 socket 


首先 .如 图 12.2 所 示 , 描 述 了 服务 器 设立 一 个 服务 的 过 程 。 设 立 一 个 筑 务 一 般 需 要 如 下 
34 ER: 
(1) 创建 一 个 socket 
socket = socket(PF_INET, SOCK_STREAM ,0) 
(2) 给 socket fii zz —~ H h- 
bind(sock, &addr, sizeof(addr)) 
监听 接 人 请 求 


listen(sock, queue_size) 


(3 


s 





F I: 
glg— T HS Bit sockel 





图 12.2 BBR $$ 0 socket 
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为 了 避免 在 编写 服务 器 时 重复 输入 上 述 代码 .将 这 3 ME, make 
server_socket。 该 函 禾 的 代码 位 于 本 章 后 面 将 给 出 的 socklib. c 文件 中 。 在 编写 服务 器 的 时 
候 , 只 要 调用 该 函数 就 可 以 创 建 一 个 服务 问 端 socket。 上 有 具体 如 下 ， 


sock = make server socker( int portnum) 


return - 1 if error, 


or a server socket listening at port "portnum" 


12.3.2 操作 2: 建立 到 服务 器 的 连接 


其 次 ,将 客户 连接 到 服务 器 。 如 图 12. 3 所 示 , 基 于 流 的 网 络 客 户 连 按 到 服务 器 包含 以 下 
两 个 步骤 ， 

(1) 创建 一 个 socket 

socket = socket(PF INET, SOCK STREAM, 0) 
(2) 使 用 该 socket 连接 到 服务 加 
connect(sock, &serv addr, sizeof(serv addr)) 

1ECUA 7e 3p ENG eB: connect, to, server. PME 户 端 程序 时 ,只 赣 调 用 该 函数 就 可 以 建立 

SUR RIDERE HEMT: 


fd = connect to_server(hostname, portnum) 


return ~ l if error, 


or a fd open for reading and writing connected to the socket at port "portnum" on host "hostname" 


5342. 创建 并 | 
XE EEF socket 


到 服务 器 





PA 12.3 mS 


12.3.3  socklib. c 


] 


/* socklib c 

* 

* This file contains functions used lots when writing internet 
~ Slien-/server programs. The two main functions here are; 

* int make servex socket( portntm ) returns a server socket 


x Or - | if error 


7 


int make server socket q(portnum ,backlog) 


+ int connect to server(char x hostname, int portnum) 








x 
* 

s 

# include 
# include 
# include 
include 
t include 
# include 
# include 


dt include 


t define 
# define 
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returns a connected socket 


or 1 if error 


~ skdio. h> 
«Lunistd. hc 
—sys/types.hc 
<lays/socket. h> 
< netinet/in.h— 
zznetdb. ho 

<< time. h^» 


«strings. h> 


HOSTLEN 256 
BACKLOG 1 


int make server socket q(int , int 5; 


int make server socket(int portnum) 


{ 


return make server socket q(portnum, BACKLOG) ; 


t 


int make_server_socket_gíint portnum, int backlog) 


{ 


struct sockaddr in saddr; 


struct hostent * hp; 


char 


int 


hostnane| HOSTLEN ! ; 


Sock id; 


sock id = socket(PF iNET, SOCK STREAM, 0); 


if ( Bock id == -1) 


return - 1; 


/* build address and bind it to socket * *; 


bzero((void + )&saddr, sizeof(saddr)) ; 


gethostname( hostname, HOSTLEN) ; 


hp = gethostbyname( hostname) ; 


/* build our address here x / 
/* this is part of our #/ 
/* address «/ 


/* the socket «/ 


/* get a socket x/ 


/* clear out struct «/ 
/* where am I ? #/ 

/* get info about host «/ 
/* fill in host part */ 


bcopy( (void *)hp- 2h addr, (void *&saddr.sin addr, 


hp 


- Ih length); 


saddr. sin port = htons(portnum); 

saddr. sin family = AF INET ; 

if ( bind(sock id, (struct sockaddr * )&saddr, 
sizeof(saddr)) 1= 0) 


return — 1; 


/* * arrange for incoming calls « «/ 


/* Fill in socket port x/ 
/* fill in addr family */ 
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if ( listen(sock id, backlog) [= 0) 
return - 1; 
return sock id; 


1 


int connect to server(char * host, int portnum) 


1 


int sock; 
struct sockaddr in servadd; /* the number to call «/ 
struct hostent * hp; /* used to get number +/ 


/* * Step 1; Geta socket * x/ 


sock = socket( AF INET, SOCK STREAM, 0}; /* get a line x/ 
if( sock == -1) 
return —- 1; 


/* * Step 2, connect to server * =/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address «/ 
hp = gethostbyname( host ); /* lookup host’s ip # x/ 
if (hp == NULL) 

return — 1; 


Li 


bcopy(hp - ~h addr, (struct sockaddr * )Eservadd. sin addr, 

hp- 2h length); 
servadd.sin port = htons(portnum); /* fill in port number */ 
servadd.sin family = AF INET ; /* fill in socket type «/ 


if ( connect(sock, (struct sockaddr * )&servadd, 
Sizeoft(servadd)) |= 0) 
return - 1; 


return sock; 


12.4 操作 3: 客户 /服务 器 的 会 话 


至 此 ,可 以 使 用 专门 的 晴 数 来 建立 服务 器 端的 socket, 同 时 也 有 专门 的 函数 来 连接 到 服务 器 。 
在 实践 中 ,如 何 利用 十 述 函 数 呢 ? 客户 和 服务 器 之 间 的 交互 内 容 又 是 什么 呢 ? 在 本 节 中 ,将 学 习 
客户 端 程序 和 服务 器 端 程序 编写 的 一 般 形 式 , 以 及 一 些 建 立 服务 器 的 设计 方案 。 

1, 一般 的 客 产 端 

网 络 客户 通常 调用 服务 器 来 获得 服务 ,一 个 监 型 的 客户 程序 如 下 : 


maint } 
{ 
int fd; 


fd = connect to server(host,port); /x call the server «/ 
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if(fd == -1) 

exit(15; /* or die 1/ 
talk «with server(Fd) ; /* chat with server x/ 
close(fd); /* hang up when done */ 


! 


PRAE talk with server AER S S RUER., APMARRATHEMA. Piin, 
e-mail Zr PURI {4 ARDS 88 3 Ue AEE. MARA RS PRS 88 36 VR 9 B X AL. 
2. 一 般 的 服务 器 端 


一 个 典型 的 服务 器 如 下 : 
nain() 
"E 
int sock, fd; /* socket and connection */ 
sock = make server socket(port); 
if(sock == -1) 
exit(1); 
while(1) 
{ 
£d = accept(sock, NULL, NULL) > /» take next cal) «/ 
if(fd == —)) 
break; /* or die «/ 
process request(fd); /* chat with client «/ 
closet fd); /* hang up when done x/ 


) 
} 


Ba SX process_request 处 理 客 户 的 请 求 。 具 体 的 内 容 取 决 于 特定 应 用 。 例 如 ,邮件 服务 
器 告诉 客户 信件 信息 ,天 气 服务 器 则 告诉 客户 天 气 情 况 。 
12.4.1 使 用 socklib. c 的 timeserv/timeclnt 

如 何 利 用 上 面 的 模板 来 建立 客户 /服务 器 系统 呢 ? 例如 ,在 该 框架 下 本 文 的 时 间 系 统 客 


户 / 服 务 器 是 怎样 的 呢 ? 图 12. 4 对 此 做 了 解释 。 为 了 使 用 socklib. c 重 写 时 间 客 户 和 服务 
器 ,这 里 编写 了 处 理会 话 的 函数 talk with, server 用 于 客户 端 ,而 process request 用 于 服务 





E 12.4 时 间 服 务 器 和 客户 闫 版 本 1 
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[E P 

talk with server( fd) process request(fd) 

{ { 
char buf LENT; time_t now; 
int n; char * cp; 

time (&now) ; 

n= read( fd, buf, LEN) ; cp = ctime(&now) ; 
write(l, buf, m); write(fd,cp,strlen(cp)); 


! } 


服务 器 调用 ime 从 内 核 中 获得 时 间 , 然 后 用 ctime 将 时 间 和 转换 成 可 以 打印 的 字符 捉 。 
服务 器 将 该 字符 申 写 到 socket 中 ,发 送 给 客户 端的 socket, APM socket 中 读 肥 该 字符 申 ， 
然后 写 到 标准 给 出 中 。 这 个 新 的 版 本 遵循 了 先前 版 本 的 程序 逐 辑 ,但 是 设计 更 加 模块 化 , 代 
码 更 加 清晰 ， 


12.4.2 第 2 版 的 服务 器 : 使 用 fork 


现在 考虑 第 二 版 服务 器 的 设计 。 第 二 版 中 程序 没有 通过 调用 time 函数 来 获得 代表 时间 
的 数据 ,而 是 直接 使 用 了 一 个 shell 命令 (date 命令 ) ,如 图 12. 5 Bim. 


limcd — 








图 12.5 服务 露 使 用 fork 运行 date 
代码 如 下 : 


process_request< fd) 
fx 

* send the date out to the client via fd 
i / 


{ 
int pid = fork(); 


switch( pid) 

{ 
case ~ 1}: return; /* can not provide service +/ 
case 0:;dup2( fd, 1); /* child runs date x/ 


close(fo); /* by redirecting stdout «/ 
exec) ("/bin/date", "date" NULL) ; 


oops( "execlp"); . /* or quits «/ 
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default, wait(NULL); /* parent wait for child x/ 


i 


如 图 12.5 所 示 , 服 务 器 用 fork 建立 一 个 新 的 子 进 程 。 该 子 进程 将 标准 输出 重 定 向 到 
socket ,然后 运行 date, date 俞 令 给 出 口 期 ,然后 将 日 期 写 到 标准 输出 ,这 样 就 把 字符 串 发 送 
HAPT. EEF PAA T wait. shell 通常 在 调用 fork 后 要 调用 wait, 3B Aix E AI 8 FH 
有 意义 吗 ? 本 文 将 在 下 一 节 中 探讨 该 问题 。 


12.4.3 服务 器 的 设计 问题 : DIY 或 代理 


这 里 使 用 了 两 种 服务 器 的 设计 方法 : 

。 自己 做 (Do It Yourself, DIY): 服务 器 接收 请 求 ,自己 处 理 上 作 。 

€ 代理 … 一 服务 器 接收 请 求 , 然 后 创建 一 个 新 进程 来 处 理工 作 ， 

每 种 方法 的 优 缺 点 各 是 什么 ? 

。 HERI Bosé qi ay Fe de 

计算 当前 的 日 期 和 时 间 需 要 系统 调用 time ME AH ctime。 使 用 fork 和 exec 来 运行 


$8 E] ci SE a EF B E listen 中 限制 连接 队列 的 大 小 。 文 件 socklib. e 中 的 make server 
socket q 图 数 以 队列 大 小 作为 参数 。 

> 代理 用 于 慢 速 的 更 加 复兴 的 任务 

服务 器 处 理 耗 时 的 任务 或 等 待 资源 时 ,需要 代理 来 完成 其 工作 。 这 就 像 商务 中 的 电话 
接线 员 ,接收 电话 ,把 连接 传递 到 下 一 个 销售 或 服务 人 员 ,然后 再 回 过 去 接收 下 一 个 电话 ,而 
服务 器 可 以 使 用 fork 创建 一 个 新 进程 来 处 理 每 个 请 求 。 通 过 这 种 方式 ,服务 器 可 以 同时 处 
理 多 个 任务 。 

* 使 用 SIGCHLD 来 阻止 僵尸 (xombie) 问 题 

除了 等 待 子 进程 死亡 外 , 父 进 程 可 以 设置 为 接站 表示 子 进 程 死亡 的 信号 ,第 8 章 中 解释 
了 当 子 进程 退出 或 被 终止 时 ,内 核发 送 SIGCHLD 给 父 进程 。 但 它 不 同 于 本 文 讨 论 的 其 他 信 
号 ,默认 时 SIGCHLD 是 被 忽略 的 。 父 进程 可 以 为 SIGCHLD 设置 一 个 信和 号 处 理应 数 , 它 可 
以 调用 wait。 上 基体 方法 如 下 : 


/* naive use of SIGCHLD handler with wait() ~ buggy */ 





maini) 

{ 

int sock, fd; 

void chiid waiter(int),process request(int); 

signal (SIGCHLD, child_waiter) ; 

if((sock = make_server_socket(PORTNUM)) = = - 1) 
oops("make server socket"): 

} 

whilecl? i 
fd= accept( sock, NULL, NULL) : 
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ififd-- -1) 
break; 
process request(fd}; 
close(fd) ; 
t 


\ 
D 


void child waiter(int signum) 


wait(NULL); 
i 
void process request(int fd) 
{ 


if(fork() == 0) | /* child */ 
dup2(fd,1); /* moves socket to fd 1 */ 
close( fd); /^* closes socket x/ 


execlp("data", "date", NULI); /x exec date «/ 


oops("execlp date"); 
] 
} 


TRDEAREDRUY AO ERE. MARRIR SOE RU fork, JUS Ac EB 
返回 去 接收 下 一 个 清 求 , 让 子 进程 去 处 理 请 求 。 当 子 进程 退出 时 , 父 进程 收 到 SIGCHLD (8 
叶 , 跳 到 处 理 函 数 并 调用 wait。 子 进程 从 进程 表 中 被 删除 , 父 进程 从 处 理 函 数 返 回 到 主 函 
数 。 该 过 程 看 上 去 似乎 很 完美 了 ,不 过 其 中 存在 着 两 个 问题 。 

问题 1 是 程序 运行 到 信号 处 埋 阴 数 跳 转 时 会 中 断 系 统 调用 accept。 当 accept 被 信号 
中 断 时 ,返回 一 1, 然 后 设置 errno 8| EINTR。 代 码 中 把 accept 返回 的 一 1 作为 错误 ,然后 从 
主 循环 中 跳出 来 。 这 里 需要 更 改 main 函数 来 区 分 真正 的 错误 和 被 打 断 的 系统 调用 所 产生 
的 错误 。 这 个 作为 练习 ,由 读者 完成 。 

问题 2 关于 Unix 是 如 何 处 理 多 个 信号 的 。 如 果 多 个 子 进程 几乎 同时 退出 ,将 会 发 生 
什么 ? 假设 同时 有 3 个 SIGCHLD 发 送 到 父 进程 。 最 先 到 达 的 信 生 导致 父 进程 跳 到 处 理 丙 
数 ,然后 父 进程 调用 wait 来 保证 子 进程 已 经 从 进程 表 中 删除 。 这 样 就 可 以 了 吗 ? 

当 父 进程 在 运行 信号 处 理 函 数 时 ,其 他 两 个 信号 的 到 达 导 至 Unix 限 塞 ,但 是 并 不 缓存 
信和 号。 从 而 ,第 二 个 信号 被 阻塞 ,而 第 三 个 信号 丢失 了 。 此 时 ,如 果 还 有 其 他 的 子 进程 退出 ， 
来 自 于 这 些 子 进程 的 信号 也 将 亚 失 。 信 和 号 处 理 函 数 只 调用 了 wait 一 次 ,所 以 舞 次 丢失 一 个 
信和 号 意味 着 少 调用 了 -- 次 wait, BORE Ee a (EP ERE (zombie), f d Jr 3 de TE Ab BE RR 
中 调用 wait 足够 多 的 次 数 来 去 除 所 有 的 终止 进程 。waitpid KRR TIERE: 





void child waitertint signum) 


H 
1 


while(waitpidti - 1, NULL, WNOHANG) 7-0) ; 
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waitpid 提供 了 wait 函数 超 集 的 功能 。 其 第 一 个 参数 表示 它 所 要 等 待 的 进程 D S. (B 
一 ! 表示 等 待 所 有 的 子 进程 。 第 二 个 参数 是 指向 整 志 值 的 指针 ,用 来 获取 状态 。 有 最 务 器 并 不 
关心 子 进程 中 发 生 了 什么 ,不 过 一 个 健壮 的 服务 器 可 能 用 该 信息 米 跟 踪 错 误 。 

waitpid 的 最 后 一 个 人 参数 表示 选项 ， WNOHANG 参数 告诉 waitpid: MRM ARF ut 
EE Aa EFF 

该 循环 直到 所 有 退出 的 子 进 程 都 被 等 待 了 才 停 止 。 即 使 多 个 子 进程 同时 退出 并 产生 了 
多 个 SIGCHLD. Ar HM ix fs SABA BAL, 


12.5 编写 Web 服务 器 


SNC. CASA ST MS Web 服务 器 的 必 备 知识 。Web 服务 器 是 已 经 编写 的 目录 服务 器 
的 扩展 ， 主 要 的 扩展 是 一 个 cat 服务 器 和 一 个 exec 服务 器 。 


12.5.1 Web 服务 器 功能 
Web 服务 器 通常 要 具备 3 种 用 户 操作 
(1) WE B ER. 


(2) cat X (E, 
(3) 运行 程序 。 





图 12.6 Web IR 8 $i (Ht it FE Is cat exec 


Web IRS do il AF HLM socket 连接 为 客户 提供 上 述 3 种 操作 。 如 图 12.6 所 示 ,用 户 
连接 到 服务 器 后 ,发送 请 求 , 然 后 服务 器 返回 客户 请 求 的 信息 .和 具体 过 程 如 下 ， 


ders. DS E m 
用 户 选择 -- 个 链接 
连 淡 服务 器 一 接收 请 求 
Sk 一 BR IK 
目录 :显示 目录 列表 


文件 :显示 内 容 

:cgi 文件 :运行 

T: 错误 消息 
读 取 应 答 -— 写 应 管 
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挂 断 

显示 应 管 
html :解析 
image: t% Ki 
sound; 运行 


重复 z 
12.5.2 设计 Web 服务 器 


所 要 编写 的 操作 如 下 。 

(OD 建立 服务 器 

可 以 使 用 socklib. c 中 的 make server socket. 

(2) 接收 请 求 

使 用 accept 来 得 到 指向 客户 端的 文件 描述 符 。 可 以 使 用 fdopen 使 得 该 文件 描述 符 转换 
成 缓冲 流 。 

(3) 读 取 请 求 

什么 是 一 个 请 米 ? BP RRR IRS? RARE. 

(4) 处 理 请 求 

已 经 知道 了 如 何 列 出 日 录 信 息 、cat 文件 以 及 运行 程序 。 通 过 opendir fll readdir、open 
和 read .dup2 和 exec 的 使 用 可 以 实现 上 述 功能 。 

(5) 发 送 应 等 

什么 是 一 个 应 答 ? 客户 端 期 待 接 收 的 又 是 什么 ”这 些 也 需要 进一步 地 学 习 。 至 此 ,已 
经 学 习 了 几乎 所 有 的 编号 Web 服务 器 的 知识 和 技能 ， 所 剩 的 是 Web 服务 器 协议 的 学 习 。 


12.5.3 Web 服务 器 协议 


客户 端 (浏览 器 ) Web 服务 器 之 间 的 交互 主要 包含 客户 的 请 求 和 服务 器 的 应 答 。 请 求 
和 应 等 的 烙 式 在 超 文 本 传输 协议 (HTTP? 中 有 定义 。HTTP 像 上 一 章 中 的 时 间 服 务 器 和 
finger 服务 句 的 协议 一 样 , 使 用 纯 文本 。 就 像 在 时 间 服 务 器 和 finger 服务 器 中 所 做 的 ,这 里 
可 以 使 用 telnet 和 Web RRB Bt 5. Web 服务 器 在 端口 80 监听 。 下 面 是 一 个 实际 的 
例子 : 





$ telnet www, prenhall. com 80 
Trying 165.193.123.253... 
Connected to www. prenhall.com. 
Escape character is '^;'. 


GET /index, html HTTP/1.0 


HTTP/1.1 200 OK 

Server; Netscape — Enterprise/3.6 SP3 
Date:Tue, ż2 Jan 2002 16,11.14 GMT 
Content — type: text/html 
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Last - modified.Fri, 08 Sep 2000 20.20.06 GMT 
Content  length:327 
Accept — ranges, bytes 


Connection; close 


< HTML > << HEAD => 

<META HTTP-EQUIV = "Refresh"CONTENT = "0; 
URL = http; //vig. prenhall. com/ ">> 

<<< {HEADS «BODY T << (BODY > «7 / HTML > 





Eh meme-2- ---…------------------------------- `> 
Se a Caught you peeking! neci 


«I = nee ee AE E ne 
m 





Connection closed by foreign host. 


$ 


KARAT TERK HER TSAR. ERATIS? 

i. HTTP HR: GET 

telnet 创建 了 一 个 socket 并 调用 了 connect 来 连接 到 Web IRS. MG BIE SE RIF 
来 ,并 创建 了 一 个 基于 socket 的 从 客户 端的 键盘 到 Web 服务 进程 的 数据 通道 ， 

接 下 来 , 输 人 请 求 : 


GET /index. htm! HTTP/1.0 


一 个 HTTP 清 求 包含 有 3 个 字符 串 。 第 一 个 字符 上品 是 命令 ,第 二 个 是 参数 ,第 三 个 是 所 
用 协议 的 版 本 号 。 在 该 例子 中 ,使 用 了 GET 命令 ,以 index html 作为 参数 ,使 用 了 HTTP 
版 本 1.0。 

HTTP 还 包 会 儿 个 其 他 的 命令 。 大 部 分 Web 请 求 使 用 GET, 因 为 大 部 分 时 间 中 用 户 是 
单 击 链接 来 获取 网 页 。GET 命令 可 以 跟 几 行 参数 。 这 里 使 用 了 简单 的 请 求 ,以 一 个 空 行 来 
表示 参数 的 结束 ,并 使 用 与 本 书 前 面 提 及 的 关于 shell 的 相同 约定 。 实 际 上 ,一 个 Web 服务 
器 只 是 集成 了 eat 和 js 的 Unix shell, 

2. HTTP & £-; OK 

服务 器 读 到 请 求 ,检查 请 求 ,然后 返回 一 个 请 求 。 应 答 有 两 部 分 : 头 部 和 内 容 。 头 部 以 
状态 行 起 始 , 如 下 所 示 ，; 


HTTP/1.1 200 OK 


TRASH 8 PIT EU EM ESOB. ST i MUSS PO KB X PR. 
是 200,H 3E BU E OK。 这 里 请 求 的 文件 叫 /info. html, 而 服务 器 给 出 应 答 表 示 可 以 
得 到 该 文件 。 如 果 服 务 器 中 没有 所 请 求 的 文件 名 ,返回 码 将 是 404, 其 解释 将 是 “未 找到 ”。 

头 部 的 其 余部 分 是 关于 应 答 的 朵 加 信息 。 在 该 例子 中 ,附加 信息 包含 服务 器 名 应答 时 
间 , 服 务 器 所 发 送 数据 类 型 以 及 应 管 的 连接 类 型 。 一 个 应 管 头 部 可 以 包 合 有 多 行 信息 ,以 空 
行 表 示 结 束 ; 空 行 位 于 Connection:close AM. 

应 答 的 其 余部 分 是 返回 的 具体 内 容 。 这 里 ,服务 器 返回 了 文件 /index. html HAR. 
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3. HTTP 小 结 

& Pw web 服务 器 父 互 的 基本 结构 如 下 ; 
CD 客户 发 送 请 求 

GET filename HTTP/ version 

可 选 参 数 

空 行 

(2) 服务 器 发 送 应 答 


HTTP/ version status-code status-message 


附 如 信息 
空 行 
Ae 


协议 的 完整 描述 可 以 参阅 网 上 的 版 本 1.0 的 RFC1945 和 版 本 1. 1 的 RFC2068, 
Web 服务 器 必须 接收 客户 的 HTTP 请 求 , 并 发 送 HTTP 应 答 。 请 求 和 应 答 采 用 纯 文 本 
格式 ,是 为 了 便于 使 用 CC 中 的 输 人 /输出 以 及 字符 串 丽 数 读 皮 和 处 理 。 


12.5.4 编写 Web ke 
要 求 Web IRS BARE GET 命令 ,只 接收 请 求 行 , 跳 过 其 余 参 数 ,然后 处 埋 请 求 和 发 送 


应 答 , 主 要 循环 如 下 ， 

while(1) 

{ 
fd = accept( sock , NULL, NULL) ; /* take a call */ 
fpin- fdopen(fd,"r"); j» make it a FILE« #/ 
fgets(fpin, request,LEN); /* read client request x/ 
read until crni(fpimn; /* Skip over arguments x/ 
process rq(request,fd); /* reply to client «/ 
fclose(fpin); /* hang up connection »/ 

! 

为 了 简洁 起 见 , 这 里 忽略 了 出 错 检 查 。 

L RHE 


处 理 请 求 包含 识别 命令 和 根据 参数 进行 处 理 ， 


process rq( char * rg, int fd ) 
{ 
char cmd| 11], arg[513]; 


if C fork() {= 0) fe if a child, do work */ 


return; /* if parent,return x/ 


sscanf(rq, "* 10s &512s", cmd, arg); 


if ( stremp(emd, "GET") |= 0) /* check command +, 
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cannot do(fd5; 





else if ( not exist( arg) ) /* does the arg exist */ 
do 404(arag, fd); /* ni tell the user */ 
else if ( isadir( arg ) ) /* is it a directory? x/ 
do ls( arg, fd 5; /* y. list contents «/ 
else if ( ends in cgi( arg) ) /* name is X. cgi? */ 
do exec( arg, fd); /* y, execute it «/ 
else /* otherwise */ 
do cat( arg, fd); /* display contents x/ 


i 


服务 器 为 每 个 请 求 创建 一 个 新 的 进程 来 处 理 。 子 进程 将 请 求 分 割 成 命令 和 参数 。 如 果 
命令 不 是 GET, 服 务 器 应 答 HTTP 返回 码 表示 未 实现 的 命令 。 如 果 命 令 是 GET, 服 务 器 将 
期 望 得 到 目 水 各 ,一 个 以 . cei 结尾 的 可 执行 程序 或 文件 各 。 如 盯 没 有 该 目录 或 指定 的 文件 
名 ,服务 器 报错 ， 

如 果 存 在 目录 或 文件 ,服务 器 决定 所 要 使 用 的 操作 : ls exec 或 cat, 

2. 目录 列表 函数 
BR do Is 处 理 列 出 目录 信息 的 请 求 : 


do lstchar x dir, int fd) 
i 


FILE * fp; 

fp = fdopen(fd,"w") ; /* make socket into a FILE « x/ 
header(fp, "text/plain'); /* send HTTP reply header */ 
fprintf(fp,"\r\n"); /* and end of header mark x/ 
fflush(fp): /* force to socket »/ 

dup2(fd, 1); /* make socket stdout */ 
dup2(fd,2); /* make socket stderr «/ 
close(fd); /* close socket x/ 


execl("/bin/ls","ls","— l",dir,NULL); /* ls - l does the work */ 
perror(dir); /« or it doesn’t */ 
exittl}; /* child exits «/ 


} 


这 时 没有 像 前 面 章节 中 的 目录 服务 … 样 使 用 popen, 而 是 通过 调用 ls 命令 ,避免 了 客户 
f] shell popen 传递 任意 字符 串 来 运行 的 问题 。 

3、 其 他 通 数 

其 他 的 函数 包含 在 本 章 的 后 和 面部 分 中 。 程 序 可 以 工作 ,但 它 并 不 完整 ,也 不 安全 。 需 要 
和 做 如 下 的 改进 : 

(1) B P ERRPEE RS s 

C2) 缓存 洪 出 保护 ; 
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(3) CGL Common Gateway Intctrface, 通 用 网 关 接口 ?程序 需要 设置 一 些 环境 变 量 ; 


(4) HTTP 头 部 可 以 包含 更 多 的 信息 ， 
该 程序 是 一 个 包含 230 行 C 代 码 的 完整 的 Web 服务 器 ;包含 注释 和 空 行 。 


12.5.5. 运行 Web 服务 器 
编 详 程 序 ,在 某 个 端口 运行 它 ; 


$ cc webserv.c socklib.c - o webserv 


$ ./webserv 12345 


现在 可 以 访问 Web 服务 器 ,网 此 为 beep; //yourhostname;12345/. X html 文件 放 到 该 
Hae pot AA http: //yourhostname; 12345//filename. html 来 打开 它 。 创 建 下 面 的 shell 
BA. 

E ! /bin/sh 

f hello. cgi-a cheery cgi page 

printf "Content-type: text/plain\n\nhelio\n"; 


WE 43% hello. cai, Al chmod 改变 权限 为 755, 然 后 用 浏览 器 调用 该 程序 : http. // 


yourhostname; 12345/hello, cgi. 
12.5.6  Webserv 的 源 程 序 
让 面 是 简单 Web IRS ARR: 





¿x webserv.c a minimal web server (version 0.2) 
x usage; ws portnumber 


E features. supports the GET command only 


* runs in the current directory 

* forks a new child to handle each request 

* has MAJOR security holes, for demo purposes only 
* has many other weaknesses, but is a good start 

x build; cc webserv.c socklib.c - o webserv 

xy 


Zinciude «lstdio. h> 
stinclude =i sys/types. h> 
# include <Usys/stat. h> 


i include «string. h> 


main(int ac, char x av[] 


F 
1 


int sock, fd; 
FILE * fpin; 
char | request[ BUFSIZ]; 
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if (ac == 1)! 
fprintf(stderr, "usage, ws portnum\n"); 
exit(1); 

} 


sock = make server socket( atoilav[]]) ); 


if ( sock == -1) exit(2); 
/* main loop here */ 


while(1){ 
/* take a call and buffer it «/ 
fd = accept( sock, NULL, NULL ); 
fpin = fdopen(fd, "r" >; 


/* read request x/ 
fgets(request,BUFSIZ,fpin); 

printf("got a call, request = $a", request); 
read til _crnl(fpin); 


/* do what client asks */ 


process rq(request, fd); 


fclose(fpim; 


Ix dui. € (p db 





read til crnl(FILE ») 


skip over all request info until a CRNL is seen 








read til crnl(FILE * fp) 
{ 
char buf[ BUFSTZ]; 
while( fgets( buf, BUFSIZ,fp) |= NULL && strcmp(huf, "\r\n") |= 0); 


process_rgq{ char * rg, int fd ) 

do what the request asks for and write reply to fd 
handles request in a new process 

rq is HTTP command: GET /foo/bar. html BTTP/1.0 


Doke k > = “ MET, 





process rq( char * rq, int fd ) 
i 


char cmd[ BUFSIZ|, arg BUFSIZ!; 


/* Create a new process and return if not the child */ 
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if ( fork() t= 0) 


return; 


strcpy(arg, "./"); /* precede args with ./ «^ 
if ( sscanfírg, " 58$ s", cmd, arg tZ) t= 2) 


return; 


if ( stroemp(cmd, "GET") I= 0) 
cannot do( fd); 
else if ( not_exist( arg ) ) 
do 404(arg, fd 5; 
else if ( isadir( arg ) ) 
do ls( arg, fd); 
else if ( ends in cgi( arg ) ) 
do exec( arg, fd}; 
else 
do cat( arg, fd}; 
} 








tx sats -----…，------------ * 
the reply header thing: all functiona need one 


if content type is NULL then don't send content type 











Oras ee wol T a a M A orci a Mure EuEMmgD- «© © tdi oat Ge xf 
header( FILE * fp, char x content type ) 
{ 

fprintf(fp, "HTTP/1.0 200 OK\r\n"); 

if ( content type ) 

fprintf(fp, “Content-type; *s\r\n", content type ); 

} 
fe eon E Exe eumd n PO t he cm TC x 

simple functions first; 

cannot do(fd) vninplemented HTTP command 
and do_404( item, fd) no such object 
ee DR CPA PS i NS ME a a x4 


cannot do(int fd) 


J 
1 


FILE + fp = fdopen(fd, "w"); 


fprintf(fp, "HTTP/1.0 501 Not Implemented\r\n") ; 
fprintf(fp, "Content- type, text/plain\r\n")- 
fprintf(fp, "\r\n"); 


fprintf(fp, "That command is not yet implemented\r\n") ; 
fclose(fp); 
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do 404(char * item, int fd) 


í 


Jw 


FILE x fp = fdopen(fd,"w"); 


fprintf(fp, "HTTP/1.0 404 Not Found\r\n"}: 


fprintf(fp, "Content - type, text/plainVrin") ; 


fprintf(fp, "Arn"; 


fprintf(fp, "The item you requested, & sirinis not found\r\n", item); 


fclose(fp); 





the directory listing section 


isadir() uses stat, not exist() uses stat 


do 1s runs ls. It should not 


isadir(char * f) 


i 


struct stat info; 


return ( statif, &info) {= - 1 && 5 ISDIR(info.st mode) ); 


not exist(char x f) 


I 
à 


struct stat info; 


return( stat(f,&info) == -1 ); 


do ls(chaxr * dir, int fd) 


{ 


FILE * fp: 


fp = fdopen(fd,"w" 5; 
header(fp, "Ltext/plain"); 
fprintf(fp, r\n"); 
fflush(fp); 


dup2(fd,1); 
dup2(fd,25; 
close(fd) ; 


@xecl pl Wet “lgt n" i" dir NULL); 


perror(dir); 
exit( 1) A 


,一 一 "一 一 一 ~ 一 一 一 一 一 一 一 一 ~ -一 一 -,-- 
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the egi stuff. function to check extension and 


one to run the progran. 








———  ———— i - af 
char * file_type(char +f) 
/* returns 'extension' of file */ 
{ 
char x cp: 
if ( (cp = strrchr(f, '.' >) |= NULL) 
return cpt+1; 
return "". 
1 
ends in cgi(char * f) 
1 
return ( strcmp( file type(f), "cgi" ) == 0); 
1 
do exec( char x prog, int fd) 
{ 
FILE * fp; 
fp = fdopen(fd,"w"); 
header(fp, NULL); 
£flush(fp); 
dup2(fd, 15; 
dup2(fd, 2); 
close(fd) ; 
execl (prog, prog, NULL) ; 
perror( prog} ; 
} 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 
do cat(filename,fd) 
sends back contents after a header 
ETE x/ 





do cat(char * f, int fd) 
{ 


char x extension = file type(f); 
char x content = "text/plain"; 
FILE x fpsock, * fpfile; 
int e; i 
if ( stremp(extension,"html") == 0) 
content = "text/html": 


else if ( stromp(extension, "gif") == 0) 
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} 


content = "image/gif"; 

else if ( strcmp(extension, "jpg") == 03 
content - "image/jpeg"; 

else if ( stremp(extension, "jpeg") == 0) 


content - "image/jpeg"; 


fpsock = fdopen(fd, "w"); 
fpfile = fopen( £ , "r"}> 
if ( tpsock [= NULL && fpfile p= NULL } 
1 
header( fpsSock, content); 
tfprintf(fpsock, “\r\n"); 
while( (c = getc(fpfile) ) t= EOF) 
putc(c, fpsock); 
fclose(fpfile); 
fclose(fpsock); 
} 


exit(0):; 


12.5.7 比较 Web 服务 器 


Web 服务 器 允许 其 他 机 器 上 的 客户 得 到 具 录 信息 . 读 取 文件 和 运行 程序 。 所 有 的 Web 


服务 器 都 要 完成 这 些 基 本 操作 ,并且 必须 遭 守 HTTP 协议 。 


奢 么 服务 器 之 问 有 什 公 区别 呢 ? 有 的 服务 器 容易 配置 和 操作 ,有 的 提供 了 更 多 的 安全 
特征 ,有 的 则 快速 处 理 请 求 或 使 用 较 少 的 内 存 。 其 中 -个 重要 的 特征 是 服务 器 的 效率 问题 。 
服务 器 可 以 同时 处 理 多 少 个 请 求 ” 对 于 每 个 请 求 , 服 务 器 需要 多 少 系统 资源 ? 

本 书 的 Web 服务 器 对 于 每 个 请 求 部 创建 新 进程 来 处 理 。 这 是 最 高 效 的 方法 吗 ? 读 取 文 
件 和 目录 的 请 求 需要 较 长 的 时 间 , 所 以 服务 器 没有 必要 等 待 这 些 操作 完成 ,但 是 有 必要 用 一 


个 新 的 进程 吗 ? 


有 第 三 种 方法 可 以 同时 运行 多 个 拘 作 。 程 序 可 以 在 一 个 进程 中 运行 多 个 任务 ,这 可 通 


过 使 用 线程 (thread) 来 实现 。 在 后 面 的 章节 中 将 学 习 它 的 使 用 。 


l. 
* 基于 socket 的 客户 /服务 器 程序 遵循 Aor., A a A OR PR 


Lb zh 
主要 内 容 


服务 器 建立 服务 器 端 socket， 服 务 器 端 socket AAMAS MAL. RD eo E. 





客户 创建 和 使 用 客户 端 socket。 客 户 并 不 英 心 客户 端 socket 的 地 址 。 
服务 器 可 以 用 两 种 方法 之 一 处 理 请 求 : 自己 处 理 请 求 , 或 使 用 fork 创建 新 进程 来 处 
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理 请 求 。 
。 Web 服务 器 是 最 受 欢 迎 的 基于 socket 的 程序 。Web 服务 器 处 理 3 种 类 型 的 请 求 
返回 文件 内 容 . 莫 录 列 去 和 运行 程序 。 请 求 和 应 答 协 议 称 为 HTTP. 
2. 下 一 步 做 什么 
电话 呼叫 模型 不 是 客户 和 服务 器 通 借 的 惧 一 方式 。 有 些 人 通过 邮件 发 送 定 购 请 求 来 买 
商品 。 使 用 基于 消息 的 通信 系统 ,每 个 购物 者 可 以 一 次 处 理 多 个 商店 的 购物 ,而 商店 可 以 同 
时 处 理 多 个 顾客 的 请 求 。 在 下 一 章 中 ,将 学 习 使 用 明信片 模型 的 网 络 编程 : 数据 报 
(Datagram) socket, 
3. 习题 
12.1 在 时 间 服 务 的 例子 中 凋 用 了 read 和 write — iR. Bn Hi 45 2E 3a RKILEN RH 
分 儿 次 到 达 或 超出 继 存 的 大 小 将 会 怎样 ? 如 果 客 户 端 需要 多 次 调用 read. n 
何 修改 ?在 服务 器 端 ,write 的 返回 值 小 于 字符 串 的 长 度 , 又 会 怎样 ? 


12.2 修订 版 的 SIGCHLD AAt HE RAE waitpid 和 -个 循环 。 那 么 可 以 在 一 个 循 
环 中 使 用 常规 的 wait 来 处 理 多 个 信号 问题 吗 ? 

4. 编程 练习 

12.3 ”改写 本 章 中 的 一 般 服 务 器 借 型 ,使 得 它 被 信号 中 断 时 ,可 以 重 起 调用 accept, 

12.4 改写 Web 服务 器 ,使 得 它 保 留 所 有 请 求 和 返回 状态 的 日 志 信 息 。 

12.5 “4 Web 服务 器 接收 CGI 程序 请 求 时 ,服务 器 将 设置 一 些 CGI REI BORSE ERE, 


找 出 这 些 环境 变量 ,并 把 其 中 的 一 些 如 到 Web 服务 器 中 。Shel] 一 章 中 解释 了 如 
何 设置 环境 变量 。 


12.6 Web 服务 器 可 以 使 用 两 种 方法 来 识别 每 个 请 求 所 要 运行 的 程序 。 本 章 中 是 以 , 
cgi 作为 扩展 名 来 识别 要 运行 的 程序 。 另 一 种 方法 是 使 用 路 径 。 特 别 地 ,如 果 请 
求 的 路 径 中 包含 有 上 有 目录 名 cgi-bin, 该 程序 就 被 运行 。 例 如 ,对 于 /cgi-bin/counter 
的 请 求 在 该 系统 下 将 被 服务 器 执行 。 改 写 服 务 器 以 支持 这 种 方法 。 


12.7 改写 Web 服务 器 使 得 它 可 以 发 送 现 名 的 信息 。 忆 中 例子 中 的 连接 给 出 了 典型 的 
头 部 项 的 集合 。 将 这 些 项 增加 到 Web 服务 器 中 ， 


12.8 改写 Web 服务 器 以 支持 HEAD WR. Ri HTTP 协议 获取 详细 信息 ， 
12.9 改写 Web 服务 器 以 支持 POST WR. Mi HTTP 协议 获取 详细 信息 ， 


5 "RH 
ETZERA, TAIHA PF TAY Unix 程序 ; 


httpd.telnetd,fingerd,ftpd 
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概念 与 技巧 

， 基于 数据 报 的 编程 ,数据 报 socket 
* TCP 与 UDP 

许可 证 服务 器 

> 软件 时 间 惟 (CSoftware ticket) 

© 设计 健壮 系统 

> 设计 分 布 式 系统 

* Unix 域 的 socket 

相关 的 系统 调用 与 函数 


* socket 


^ sendto,recvírom 


13.1 软件 控制 


程序 的 运行 需要 内 存 .CPU 和 一 些 系 统 资源 。 操 作 系 统 关 心 这 类 事情 ,但 是 一 些 程序 还 
需要 关心 男 一 件 事情 : 就 是 程序 期 有 者 的 允许 。 

从 合法 性 的 角度 讲 , 需 要 有 一 个 许可 证 (icense) 来 保证 程序 的 合法 运行 ,但 是 有 些许 可 
证 却 是 带 有 限制 的 。 例 如 ,有 的 许可 证 是 限制 同时 运行 程序 的 用 户 数 。 一 个 10 人 的 许可 证 
可 能 需要 一 定 的 花费 ,而 50 人 的 许可 证 可 能 需要 更 多 的 花费 。 有 些 厂 商 租赁 软件 许可 证 , 当 
租赁 期 到 了 ,程序 就 不 能 继续 运行 。 当 然 除了 合法 性 方面 之 外 ,软件 也 还 受到 其 他 一 些 因素 
的 限制 。 学 校 里 的 计算 机 房 就 可 能 限制 每 天 游戏 程序 运行 的 次 数 。 

有 些 软件 拥有 者 使 用 减 信 机 人 制 来 限制 程序 的 使 用 ,他 们 把 许可 证 条 款 打 印 在 屏幕 上 或 
纸 上 并 要 求 用 户 遵守 协约 。 其 他 的 则 使 用 特定 的 技术 来 实施 许可 证 条 款 。 





D 本 章 的 内 容 基于 Lawrence deLuca 在 哈佛 职业 教育 誉 院 担任 助 数 期 间 编 写 的 讲稿 ,该 讲稿 取材 于 他 参与 开发 的 
一 个 产品 。 
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一 种 实施 许可 证 技术 是 编写 程序 来 执行 许可 证 控制 。 通 常 的 做 法 是 设计 从 一 个 许可 证 
服务 器 获得 许可 的 应 用 程序 。 该 服务 器 是 -- 个 进程 , 它 授权 应 用 程序 的 运行 。 
许可 证 服务 器 明确 许可 证 条 款 并 且 强 制 执 行 该 条 款 , 如 图 13. 1 所 示 。 











图 13,.1 许可 证 服务 器 给 予 许可 


请 求 许可 和 给 予 许可 需要 客户 和 许可 证 服务 器 之 间 的 通信 。 

许可 证 服务 器 是 如 何 工作 的 ? 本 章 将 学 习 一 个 其 体 的 客户 /服务 器 洗 可 证 控制 模型 。 
通过 该 模型 的 学 习 ,可 以 接触 到 另外 一 种 类 型 的 socket- 数据 报 socket, 另 外 的 一 个 地 址 
域 一 一 Unix 域 ,一 个 维持 系统 状态 的 网 络 协议 ,以 及 其 他 一 些 有 关 设 计 安 全 健壮 的 客户 / 服 
务 器 系统 的 技术 ，。 


13,2 许可 证 控制 简 史 


软件 控制 技术 的 使 用 已 经 有 多 年 的 发 展 历 史 了 。 

在 单机 版 的 个 人 计算 机 时 代 , 对 软件 的 限制 是 靠 特定 的 磁盘 或 由 隐匿 在 特定 磁道 上 的 
密码 来 实现 的 。 科 盘 二 的 密码 很 难 被 复制 ,并 且 只 有 磁盘 在 驱动 器 中 的 时 候 程 序 才 能 运行 。 
MRA A OF RAT ,该 程序 将 不 能 再 和 运行。 人 们 很 快 就 破解 并 找到 了 如 何 来 复制 
这 种 特殊 磁盘 的 方法 ,所 以 软件 厂商 发 明了 硬件 密 钥 。 硬 件 密 铀 是 一 个 适配器 , 它 可 以 播 在 
JF H .串口 或 USB 口 上 ; 被 许可 的 程序 只 有 在 发 现 该 适配器 的 时 候 才 能 运行 。 如 果 便 件 密 
AGA ,程序 将 不 能 运行 ， 

然而 网 络 计算 机 和 多 用 户 系统 却 引起 了 新 的 问题 。 如 果 10 个 用 户 同时 想 运 行 计算 机 
或 网 络 上 的 同一 个 程序 ,那么 是 不 是 每 个 用 户 都 需要 在 服务 器 的 端口 上 插 一 个 硬件 密 负 
Ui? 软件 厂商 们 需要 一 种 可 化 的 并 且 不 需要 给 合法 用 户 增 加 额外 负担 的 方法 来 实施 许可 
证 条 款 。 

网 络 和 多 用 户 系 统 提供 了 一 种 新 的 解决 方法 : 许可 证 服务 器 。 程 序 不 是 从 磁盘 或 密 铀 
取得 许可 ,而 是 从 服务 器 进程 取得 。 许 可 证 服务 器 被 一 各 计 算 机 上 多 个 用 户 共 训 , 服 务 髓 进 
程 能 够 控制 程序 的 使 用 人 数 . 使 用 时 间 、 使 用 地 点 甚至 程序 的 使 用 方式 。 伴 随 更 多 的 计算 机 
加 入 因特网 ,服务 器 控制 对 软件 和 数据 访问 的 需求 也 更 加 迫切 。 

本 章 中 的 许可 证 服务 器 将 实施 x 用户 的 限制 。 也 就 是 说 ,服务 器 只 允许 特定 数量 的 程序 
实 讽 间 时 运行 。 
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13.3 一 个 非 计 算 机 系统 实例 : 轿车 管理 系统 


个 公司 购买 了 许可 证 .该 许可 证 限制 了 同时 使 用 程序 的 用 户 数 . Abu SEDE ICT 
可 让 所 允许 的 用 户 委 多 的 雇员 ,但 是 并 非 所 有 的 殿 员 要 同时 使 用 程序 .怎样 的 一 个 设计 才 
能 满足 上 面 的 需求 呢 ? 
现实 世界 中 有 很 多 系统 ,通常 由 一 大 群 人 来 共享 其 中 的 资源 ,而 这 些 资源 是 有 限 的 。 这 
里 将 分 析 一 个 模型 : 雇员 共享 公司 轿 牢 的 问题 ， 一 个 公司 抑 有 特定 数量 的 轿车 ,同时 还 拥有 
EZP REHE. 如 和 何 控制 对 轿车 的 使 用 呢 ” 


13.3.1 和 轿车 钥匙 管理 描述 
控制 轿车 的 使 用 是 通过 控制 对 轿车 铅 灰 的 访问 。 当 想 用 轿车 的 时 候 . 必 须 先 得 到 一 把 
Ak. MREALAPRAALT BRERA. WHAT RI 4] RE. af UL Jc dE — I4 


RSF RSA. HAC HS LIES] Her ia £8 gm XE (FRE TE RR PEL AB E 
字 。 过 程 描 述 如 图 13.2 所 示 。 


司机 Re Bike 一定 数量 的 车 
. | dz | 
Y ERA] 
S | 


EAE Rl 
> BH & 
13.2 控制 对 轿车 的 的 使 用 


签名 列表 有 何 作用 呢 ? 该 系统 的 目的 是 通过 控制 对 轿车 的 使 用 ,使 得 可 用 的 铀 匙 一 直 
很 充足 。 人 并 非 是 完美 的 .有 时 司机 会 忘记 归还 钥匙 。 钥 匙 管理 员 可 以 根据 签名 列 琢 找到 
该 司机 ,确定 他 是 否 仍 在 使 用 车 。 

轿车 使 用 管理 系统 是 控制 软件 使 用 的 一 个 现实 模型。 在 将 该 系统 转换 成 软件 系统 之 
前 ,需要 更 为 详细 地 描述 该 系统 。 

钥匙 管理 系统 的 构成 如 下 : 

(1) 乌 匙 管理 中 心 的 地 点 一 一 到 哪儿 可 以 效 得 钥匙 

(2) 乌 匙 管理 员 一 一 执行 策略 的 人 

(3) 钥匙 一 一 需要 得 到 的 东西 

(4) 签名 列表 一 一 保存 铀 匙 和 找 回 钥匙 的 记录 


13.3.2 用 宕 户 / 服 务 器 方式 管理 轿车 


在 给 出 轿车 钥匙 管理 系统 的 构成 后 ,下 面 将 用 客户 /服务 器 诺言 来 描述 该 系统 。 
OO 服务 器 和 客户 
淮 是 服务 句 和 淮 是 客户 钥匙 管理 员 拥 有 司机 需要 的 钥匙 。 用 网 络 术 滞 来 描述 . 钥 胰 
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管理 员 是 服务 器 ,司机 是 客户 。 

(2) 协议 

AAW PETA? 交互 的 事务 是 什么 ? 轿车 铀 匙 管理 协议 包括 两 个 主要 的 事务 。 

。 BRAG EAE 

客户 ; 你 好 ,我 需要 一 把 钥匙 。 

服务 器 ; 这 里 只 有 5 SHAR. WARNS . 

。 归还 钥匙 

客户 : 我 已 经 用 好 5 SAR. 

服务 器 : 谢谢 。 

(3) 通信 系统 

客户 和 服务 器 如 何 通信 ? 奔 该 系统 中 :人 们 通过 对 话 来 传递 简单 信息 。 

(4) 数据 结构 

UAHA RARE ARMM? 钥匙 管理 员 保 留 一 个 骨 户 签名 列表 ,一 
把 钥匙 对 应 列表 的 一 项 。 当 -- 个 用 户 取 走 一 把 铀 是 ,钥匙 管理 呐 在 该 项 记 下 有 用户 的 名 字 , 当 
用 户 归 还 锁匙 时 ,管理 员 把 司机 的 名 字 从 列表 中 擦 去 。 下 表 解 释 了 用 户 签 名 列表 : 





签名 列表 
司 机 


adam(@i sales 


zi 
fe 
+ 








carol@ support 


p aa W 一 


n8 EERI RRA PL PRESI, Ra AER AH. 反之 ,表示 不 可 用 。 
13.4 许可 证 管理 

本 节 将 钥匙 管理 系统 的 思想 运用 到 许可 证 管理 系统 小 。 

13.4.1 许可 证 服务 系统 : 它 做 些 什么 

图 13.3 描述 了 人 们 试 网 运行 许可 评 程序 的 过 程 。 工 作 如 下 : 

(OD 用户 U 运行 被 许可 的 程序 了; 

(2) 程序 了 向 服务 器 S 请 求 运 行 许可 ; 

GO 服务 器 检查 当前 运行 程序 了 的 用 户 数 ， 


(4) Wi EBURIASI.S 给 子 许 可 ,程序 PP 运行; 
(5) 如 果 达 到 上 限 ,S 拒绝 许可 ,程序 P 上 告诉 U 稍 后 再 试 。 
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个 用 户 murum 
ES es 
eeu | I 
A OM I 
ia > F 3 m 





sockel 


E33 控制 软件 的 使 用 


许可 证 服务 系统 与 轿车 钥匙 服务 系统 稍 有 不 同 ， 在 轿车 系统 中 .司机 向 钥匙 管理 员 请 
KFT: WERE REAP AR TO OT. RE OUH R Si ^ vmi EE TS] 01S TE JUL TT 
Xu 

EF EUA KRG PU BST. DY SIUE Jp dh. XX PST ERIETEXI— SE. DE 
FR a T EP Z yu A SATE PR RE SD WEE 3r 387 EE CT AF OR 
得 不 到 许可 ,不 能 运行 。 

这 里 以 轿车 钥 古 服务 系统 作为 异型 进行 了 讨论 。 那么 如 何 将 这 种 思想 过 用 到 软件 系统 
中 呢 ? 被 许可 程序 如 何 从 服务 器 得 到 许可 ? 服务 器 如 何 给 予 许 可 ? £X EIU WB ESI 
统 的 等 价 之 处 在 哪里 呢 ” 


13.4.2 许可 证 服务 系统 : 如 何 工作 


O) RUE BUM 

CARL TY AA E A AE ETERA E A AT OR? Bi IE EO. (EL 
(ES UT RR TRB) AS DUIS. C C A kL A IE UR A S o dic UR 
这 种 票据 又 是 什么 样子 的 呢 ? EI FUR A ERREI E OFLA BAERS apa CRI 


pid. ticketnumber 例如 : 6589.3 


每 张 票 据 包括 持 有 该 票据 进程 的 PID 以 及 票据 编号 。 在 票据 中 包含 PID 的 原因 其 实 就 
和 在 飞机 票 上 印 上 名 字 的 道理 是 一 样 的 。 票 据 中 的 PID 标识 票据 的 使 用 者 ,在 票据 丢失 时 ， 
可 以 帮助 找 回 票 据 。 进 程 可 能 丢失 票据 吗 ? 

(2) 服务 器 和 客户 

淮 是 客户 和 谁 是 服务 器 ?许可 证 服务 器 诗 有 程序 需要 的 资源 票据 。 用 网 络 求 语 , 洗 可 
证 服务 器 是 服务 器 .而 应 用 穆 序 是 客户 ， 

(3) 协议 

协议 是 什么 ”交互 的 事务 是 什么 ? 这 里 的 竖 据 管理 协议 包括 下 面 的 两 个 主要 惠 务 ， 





这 个 慨 念 并 丰 礁 理解 ， 随 着 设备 越 来 越 先进 .连接 越 来 越 方便 ,很 可 能 在 不 义 的 将 来 就 可 以 通过 你 的 收音 村 询问 
DLE GRE RSS E Ede por 
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+ SKE RC 

客户 ; HELO mypid 

服务 器 : TICK ticketid or FAIL no tickets 

。 上 归还 钥匙 

AF: GBYE ticketid 

Ik #8; THNX message 

这 里 定义 了 基于 文本 的 协议 ,协议 中 使 用 了 4 个 字符 的 简单 命令 ,这 与 前 面 的 Web 服务 
器 所 用 的 命令 类 似 。 

CO 通信 系统 

上 述 简 短 的 文本 信息 如 何在 客户 和 服务 器 之 间 传送 ? 在 本 文 后 面 将 讨论 该 问题 。 

Go 数据 结构 

客户 和 服务 器 之 间 所 用 的 数据 结构 是 什么 ”这 里 使 用 整 型 数组 作为 签名 列表 。 数 组 的 
答 个 入 口 对 应 一 张 票据 。 当 个 客户 到 由 了 一 张 康 ,管理 员 将 客户 对 应 的 PID 写 到 该 入 口 。 

















Aa TA: 
签名 列表 
con ‘tick + = process j 7 
~ 1 1234 » 
2 
3 6589 
4 Hu 


如 果 数 组 中 的 某 个 元 素 值 是 0, RA RREA. 408. de BIER ERA. 
13.4.3 一 个 通信 系统 的 例子 


Mio OR HE? ARS aR RY 这 涉及 到 进程 间 的 通信 彤 式 。 客 户 和 服务 
器 之 隔 通 过 和 消息 通 信 。 上 服务 哄 必 须 接 收 , 处 理 和 应 答 米 自 多 个 客户 的 请 求 。 目 前 ,哪些 技 
术 是 可 以 使 用 的 呢 ? 本 文 前 面 学 习 的 估 导 和 管道 机 制 可 以 考虑 ,但 是 信号 太 短 了 ,而 管道 只 
连接 相关 联 的 进程 。 所 以 ,使 用 socket 是 最 明显 的 答案 。 而 对 于 socket, 也 有 两 种 本 同 的 选 
BR. -种 是 基于 流 的 socket, 它 是 用 来 连接 不 相关 的 进程 的 。 另 一 种 socket 被 称 为 数据 报 
socket ,或 称 为 UDP ,对 于 现在 的 项 日 ,这 种 socket 是 更 好 的 选择 . 


13.5 数据 报 socket 


Wi socket 传送 数据 就 跟 电 话 网 中 传送 声音 一 样 ,客户 先 建立 连接 ,然后 使 用 该 连接 进行 
单身、 双向 或 类 似 管 道 的 字 节 流传 送 。 

数据 报道 俯 则 与 从 一 个 邮箱 到 另 - -个 邮箱 发 送 包 误 类 似 。 客 广 不 必 建 立 连 接 ,只 鉴 向 
特定 的 地 址 发 送 消息 ,而 服务 器 进程 在 该 地 址 接收 消息 。 
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Wü socket 使 用 的 网 络 协 议 叫 TCP 即 传输 控制 协 以 (Transmission Control Protocol). 
数据 报 socket nl UDP 即 几 户 数据 报 协议 (User Datagram Prorocol)。 它 们 的 区 别 是 什么 
Ug? 和 何 时 选择 何 种 socket 是 较 好 的 呢 ? 在 程序 中 如 何 使 用 数据 报 socket W? 


13.5.1 流 与 数据 报 的 比较 


socket 是 如 和 何 工作 的 ”数据 如 何在 Internet 上 传输 的 ? 当 用 户 向 流 socket 写 数据 时 ,内 
核 要 做 些 什么 ? 这 与 向 数据 报 socke 写 数据 有 何 区 别 ? 

从 一 个 流 socket 传输 到 另 一 个 流 socket 的 数据 流 , 看 上 去 是 连续 的 .无 颖 的 ,实际 上 这 
是 一 种 错觉 lnternet 连接 要 把 数据 分 割 成 独立 的 数据 包 。 网 络 数据 传输 过 程 如 图 13. 4 
所 示 。 

















图 13,4 [Internet HRA E 


在 现实 世界 中 ,有 很 多 将 一 大 抉 数据 分 割 成 若干 较 小 的 数据 块 的 例子 .假设 要 通过 快 
递 传 送 100 页 的 文档 。 当 快递 公司 要 求 你 使 用 只 能 装 20 页 的 信封 时 ,该 怎么 办 ?可 以 把 文 
档 分 割 成 5 个 包 带 ,每 个 单独 地 打包 和 附 上 地 址 。 然 后 把 这 5 个 独立 的 包 右 放 到 邮箱 中 , 运 
.和 输 系统 将 负责 把 它们 送 到 目的 地 。 在 接收 端 ,接受 者 打开 这 5 个 包 襄 ,并 把 它们 控 炬 序 重 组 
成 原来 的 文档 。 

Internet MR bia HRA KCL TED PE ir 09 5 S A MAPA AD AOR fd, KR EE 
ABE AS 90 5, 7] Se PO HE OR f BE s o WA E 9 4 J A. a ae 
Hii ul 13.5 所 示 。 





人 
EE 








&)13.5 通信 可 以 被 连接 和 中 断 


流 socket fX 2r BY .排序 .重组 的 所 有 工作 。 数 据 报 socke MAS, PROUT EMS 
间 的 区 别 。 





+ 388 + Unix/Linux 编程 实践 教程 

















TCP UDP 
流 IER rr a eee 
分 片 7 重组 下 

排序 F 

DETT T RE R £i 

tE y TRIES 


在 流 socket H, ARE KAY RRR BA SE. RL A EHE 
顺序 接收 数据 片 ,重组 成 发 送 者 所 发 送 的 原始 数据 。 在 数据 报 socket 中 ,内核 并 不 给 数据 加 
继 号 标签 ,在 日 的 邮 也 不 重组 。 l 

流 socket 对 传送 负责 ,数据 报 socket 则 不 。 流 socket 85 £z 9m he Ae Be AY IE FK 1 
BEST BIA, TEMES AXE Dui 2. A LUE Pr GS PSR EAR n Ru oq 
据 报 socket JF AAA ER RAR ARBOR fo. DIR SEP ELE UA E Internet PER RA 
Bik, TCP E UDP 做 更 多 的 工作 。UPP EK .更 简单 ,给 网 络 较 少 的 负荷 。 

UDP 接收 请 息 跟 邮箱 系统 方式 相同 : 发 送 者 将 你 的 地 址 写 在 信件 上 ,邮件 系统 负责 将 
信件 送 到 你 的 邮箱 中 ,然后 你 从 邮箱 中 取出 信 。TCP socket 需要 明确 调用 accept. read All 
close 来 读 取 远 端 进程 的 消息 。 

UDP 平 好 适合 这 里 的 应 用 。 客 户 发 送 短 消息 来 获得 许可 ,服务 器 发 送 短 消息 给 予 或 拒 
绝 许 吓 。 客 户 和 服务 器 的 交 蕊 不 需要 建立 连接 ,不 周 要 分 片 各 重组。 BD SR MEE E deo M. 
如 果 请 求 或 票据 丢失 ,客户 可 以 再 次 请 求 。 在 任何 事件 中 ,服务 器 和 客户 就 像 在 一 台 机 器 上 
或 者 --- 个 网 络 的 同一 部 分 ,所 以 丢失 数据 报 的 风险 较 小 。 

UDP 对 于 Web Bi 4r 3i e-mail 服务 是 -… 个 较 差 的 选择 。Web 服务 器 和 e-mail 信息 可 
能 是 大 的 文件 ,这 些 字 节 流 必须 完全 和 按 序 到 达 目 的 地 。UDP 对 于 允许 丢失 帧 的 声音 和 视 
频 流 是 较 好 的 选择 ， 


13.5.2 数据 报 编程 


数据 报 与 邮件 网 络 系统 类 似 , 包 括 3 个 主要 部 分 : 目的 地 址 ,返回 地 址 和 消息 ,如 图 13.6 
A AR 

















| sender destination | data | 





图 13.6 数据 报 的 3 部 分 


数据 报 socket 可 以 被 理解 成 -个 内 部 有 有 数据 的 盒子 ,发 送 省 给 出 日 的 socket 的 地 址 。 
网 络 将 数据 从 发 送 者 发 送 到 日 的 socket. EUR PERE MX socke 中 读 取 数据 。 程序 使 用 
sendto 发 送 数 据 和 rccvfrom 来 读 取 数据 ,如 网 13.7 ros. 
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一 台 主 机 可 能 有 多 个 接收 socke, GA socker BL CET 
一 个 特定 的 端口 号 。 地 让 用 主机 上 的 端口 来 区 分 。 


图 13.7 使 用 sendio M recvírom 


1， 接 收 数 据 报 
程序 dgrecv. c 是 一 个 简单 的 基于 数据 报 的 服务 器 ，dgrecv. c 使 用 命令 行 传 过 来 的 端口 
号 建立 sockert ,然后 进入 循环 ,接收 和 打印 从 客户 端 发 来 的 数据 报 : 


[RR Ee RRO RO OH ee 


* dgrecv.c - datagram receiver 


» usage, dgrecv portnum 
.* action, listens at the specfied port and reports messages 
*/ 


# include <stdio.h> 

# include <stdlib.h> 

# include <sys/types. h> 
# include <sys/socket. h> 
H include  «netinet/in. h> 


# define oops(m,x) ( perror(m);exit(x);) 


int make dgram server socket(int); 
int get internet address(char x , int, int * , struct sockaddr in » ); 
void say who called(struct sockaddr in x); 


inc main(int ac, char * av[]) 


( 


int port; /* use this port »/ 

int sock; /* for this socket «/ 

char bu£[ BUFSIZ]; /* to receive data here x/ 

size t maglen; /* store its length here «/ 
struct sockaddr in saddr; /* put sender's address here */ 
socklen t saddrien; /* and its length here «/ 

if (ac == 1 || (port = atoi(tav[1]); <= 0 ){ 


fprintf(stderr, "usage; dgrecv portmumber\n") ; 
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/* get a socket and assign it a-port number +/ 


iff (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket", 2) ; 


/* receive messaages on that socket x/ 


saddrlen = sizeof(saddr); 


while( (msglen = recvfron(sock,bhuf,BUFSIZ,0, &saddr,&saddrlen))7-0 ) 


buf[msglen] = 'XO'; 
printfi"dgrecv, got a message. * s\n", buf): 
say who called(&saddr); 


1 


return 0; 


void say who called (struct sockaddr in * addrp) 


t 


char host[BUPSIZ” ， 
int port; 


get internet address(host,BUFSÍZ,&port,addrp); 
printfí" from; 5* 5, dn", host, port) ; 


Sh BRE make dgram server socket 和 get internet. address 将 在 后 面 给 出 的 文件 deram. c 
"PEG. EAR socket 中 接收 消息 比 从 流 socket 接收 简单 reevirom PREF A SRE 
到 达 。 当 数据 报到 过时 ,消息 内 容 、 返 回 地 直 和 其 长 度 将 被 复制 到 缓存 由。 

2. 发 送 数 据 报 

程序 dgsend.c 发 送 数 据 报 。dgsend, c 创建 一 个 soeket ,然后 用 它 发 送 消息 到 以 命令 行 
SRR AMR EN EAA. 


DOO X CX ee ee ee ee ee ee ee ee eee ee ee OE ECLOG ee 


* dgsend.c > datagram sender 


usage, dgsend hostname portnum "message" 


action: sends message to hostname; portnum 


# include  «stdio. h 
# include  «zstdlib. ho 
4 dnclude  «sys/types.hz- 


H include  -—sys/socket, hr 


d include  «netinet/in, h= 


~ 


4 define oopstm,x) i perror(m);exit(x);:;: 
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int make dgram_client_socket(); 


int make internet address(char * , int, struct sockaddr in *}; 


int main(int ac, char * av[ D 


i 
4 
int 


char 


struct 


sock; /* use this socket to send x/ 
* msg; /* send this messag */ 
sockaddr in  saddr; /* put sender's address here x/ 


if (acl= 451 


fprintf(stderr, “usage, dgsend host port 'message’\n"); 
exit(l); 


} 


msg = av! 3]; 


/* get a datagram socket x/ 


if( (sock = make dgram client socket()) == -1) 


oops("cannot make socket", 2); 


/* combine hostname and portnuxber of destination into an address x/ 


make internet address(av[1], atoi(av[2]), &saddr) 


f/x send a string through the socket to that address x*/ 


if € sendte(sock, msg, strlen(msg), 0, &saddr,sizeof(saddr)) =~ -— 1) 
oops("sendto failed", 3), 


return 0; 


sendto pai Mt Ht 2X FF FAS AAS CX SI Te xg BERE socket. 
3. 辅助 函数 


创建 socket 和 socket 地 址 的 细节 被 封装 在 dgram. c 中， 


六 


* dgram.c 


* support functions for datagram based programs 


*j 


# include 
# include 
# include 
4 include 
# include 
# include 
H include 


k include 


«stdio. h> 
<"unistd. h> 
<Isys/types. h> 
<I sys, socket. h> 
«netinet/ in. h ~ 
<Tarpa/ inet. h> 
<Tnetdb. h> 

< string. h> 


# define HOSTLEN 256 
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int make_internet_address(); 


int make dgram server socket(int portnum) 


1 


struct  sockaddr in saddr: /* build our address here */ 
char hostname[HOSTLEN]; /# address x/ 
int sock_id; /* the socket */ 


Sock id = socket(PF INET, SOCK DGRAM, 0); /x get a socket «/ 


if ( sock id == -1 ) return - 1; 
/** build address and bind it to socket *x / 


gethostname(hostname, HOSTLEN) ; /* where am I ? «/ 


make internet address(hostname, portnum, &saddr); 


if( bind(sock id,(struct sockaddr x* )&saddr, sizeof(saddr)) |= 0) 


return - 1; 


return sock id; 
} 
int make dgram client socket() 
i 
return socket(PF INET, SOCK DGRAM, 0); 


int make internet address(char * hostname, int port, struct sockaddr in * addrp) 
/* 
* constructor for an Internet socket address, uses hostname and port 
* (host,port) -> »* addrp 
»/ 
{ 
struct hostent * hp; 


bzero{(void x )addrp, sizeof(struct sockaddr_in)}; 

hp = gethostbyname(hostname); 

if ( hp == NULL) return -1; 

bcopy((void * hp- >h addr, (void x) &addrp- >sin_addr, hp- —h length); 
addrp- -~sin port = htons(port); 

addrp- — sin family = AF INET; 

return D; 


} 


int get internet address(char » host, int len, int * portp, struct sockaddr in x addrp) 
fn 
* extracts host and port from an internet socket address 
*% addrp — -> (host, port) 
xf 
{ 
Strncpy(host, inet ntoa(addrp- >sin_addr), len 2; 


Wise 基于 数据 报 (Datagram} 的 编程 : 编写 许可 证 服务 器 了 * 393 + 





# partp = ntohs(addrp- 7-5in port); 


return 0; 


! 


创建 一 个 数据 报 socket 与 创建 一 个 流 socket 类 似 。 其 不 同 点 在 于 ,这 里 设置 socket 的 
类 型 为 SOCK DGRAM, 而且 不 要 调用 listen WX, 
4. 编译 和 测试 


$ cc dgrecv.c dgram.c - o dgrecv 


$ .fdgrecv 4444 & 


[1] 19383 


$ cc dgsend.c dgram.c ~ o desend 
$ ./dgsend host2 4444 "testing 123" 


dgrecv;got a message; testing 123 


from,10.200.75.200.:1041 


$ ps 

PID TTY 
14599 pts/3 
19383 pts/3 
19393 pts/3 
$ 


TIME 

00:00:00 
00,00,00 
00:00:00 


CMB 
bash 
dgrecv 


BS 


编译 服务 器 ,并 启动 它 , 使 得 它 监 听 在 端口 4444。 然 后 编译 和 运行 客户 ,使 客户 发 送 字 
符 申 到 端口 4444。 服 务 器 接收 请 息 ,打印 消息 ,并 且 打 印 消息 的 返回 地 址 。 客 户 socket 拥有 
主机 地 址 和 端口 号 ,内 核 随 机 地 给 它 分 配 了 -个 端口 号 1041。ps 进程 显示 了 服务 器 正在 


运行 。 


13.5.3 sendto 和 recvfrom 的 小 结 


























sendto 
目标 从 socket 发 送 消 息 
Lue # include < sys/ types. h> 
# include «isys/socket. h> 
ae ae nchars = sendio(ini socket, const void * msg, size_t len, int flags, const struct 
sockaddr * dest,socklen_1 dest len); 
参数 socket socket id 
msg ABMS HAH RA 
len 发 送 的 字符 数 
flags 比特 的 集合 ,设置 发 送 属 性 ,0 表示 普通 
dest 38 Im uud socket 地 址 的 指针 
dest_len ”地 址 长 讼 
iR [a] (i = 遇 到 错误 
nchars 发 送 的 字符 数 
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sendto 从 源 socket 发 送 数 据 报 到 日 的 socket。 前 3 个 参数 与 write 的 参数 类 似 : BAK 
的 socket .保存 要 发 送 字 符 串 的 数组 以 及 发 送 的 字符 数 。 与 write 类 似 ,sendto 返回 实际 发 
送 的 字符 数 。flags 参数 表明 发 送 的 各 种 属性 ; 具体 可 参见 Unix 版 本 的 帮助 信息 。 最 后 两 
个 参数 给 出 发 送 呈 的 地 的 socket 地址。 如 果 是 Internet 26) JL RE socket 地 址 包含 目的 主 
机 的 IF 地 址 和 端口 号 ,而 其 他 类 型 的 地 址 则 包含 其 他 的 成 员 。 





recvfrom 


目标 | 从 socket 接收 消息 


KM AF Ẹ include <Isys/types, h> 
E include «sys socket. h= 











函数 原型 nchars = recvfrom(int socket.const void * msg,sizc_tlen, int [lags, const struct 











参数 socket socket id 
msg 字符 类 型 的 数组 
len 接收 的 字符 数 
flags 表示 接收 属性 的 比特 的 集合 ,0 表示 普通 
sender 指向 过 端 socket 的 地 址 的 指针 


sender len — Hh hb IE HE 








"TI" Ed BAR 
nchars 接收 的 字符 数 


reevirom 从 socket 读 取 数据 报 。 前 3 个 参数 与 read 类 似 : 所 要 读 取 的 socket. FF 
符 的 数组 以 及 要 读 取 的 字符 数 。 与 read 类 似 ,reevfrom 返回 实际 接收 的 字符 数 。flags 48 iF 
了 接收 时 所 用 的 各 种 属性 ; 具体 可 参见 Unix 系统 的 帮助 信息 。 通 过 最 后 两 个 参数 ,可 以 获 
得 发 送 者 的 地 址 。 发 送 socket 的 地 址 将 被 存放 在 由 第 一 个 参数 指向 的 结构 中 ,地 址 长 着 存 
必 在 由 第 二 个 参数 指向 的 闲 型 值 中 .地 址 的 长 度 必 须 提供 给 recv[rom 函数 ; 如 果实 际 的 地 
址 是 不 同 的 长 度 , 它 将 更 改 该 值 。 如 杂 第 一 个 参数 指针 为 空 值 ;发 送 者 地 址 将 不 被 记录 。 


13.5.4 数据 报应 答 

程序 dgsend. c 和 dgrecv. c 显示 了 如 和 何 从 客户 发 送 数 据 给 服务 器 。 服 务 器 如 何 给 客户 
发 送 应 管 呢 ? 在 现实 讲 界 中 ,假设 有 人 给 你 发 送 了 一 封 晚 富 的 邀请 函 , 你 将 如 和 刹 给 出 答复 呢 ? 
这 很 简单 : 你 只 要 给 遵 请 冰 上 的 返回 地 址 加 信和 就 行 了 。 

程序 dgrecv2. c 从 客户 处 接收 消息 并 且 发 送 谢谢 作为 应 答 ， 


ee ee ee ee ee ee ee 2 


* dgrecv2.c — datagram receiver 


x usage; dgrecv portnum 
x action; receives messages, prints them, sends reply 
xf 


# include :stdio. h> 


H include  -stdlib. h> 
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# include  —unistd. h> 

# include «string, hi 

# include <Csys/types. h> 
Ë include  «sys/socket. hz» 


# include <“netinet/in. h^» 
zb define oops(m,x) i perror(m ;exit(x);} 


int make dgram server socket(int); 
int get internet address(char' ,int, int’ struct sockaddr in"); 
void say who called(struct sockaddr in x }; 


void reply to sender(int,char # ,struct sockaddr in * , socklen t); 


int main(int ac, char * avi i) 


{ 


int port; /* use this port «/ 

int sock; /* for this socket »/ 

char buf| BUFSIZ | ; /* to receive data here x/ 

size t meglen; /x store its length here */ 
struct sockaddr in saddr; /* put sender’s address here */ 
Socklen t saddrlen; /* and its length here «/ 


if (ac == 1 || (port = atoi(av[ 15) <= 094 
fprintf(stderr, usage; dgrecv portnumber\n") ; 
exit(1); 


b 
1 


/* get a socket and assign it a port number x/ 


if( (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket",2); 
/* receive messaages on that socket «*/ 


saddrlen = sizeof(saddr); 
while( (msglen = recvfrom(sock,buf,BUFSIZ,0, &saddr,&saddrlen))720 ) { 
bufi msglen] = 'XAO'; 
printf("darecv, qot a message; * sin", buf); 
say who called(&saddr); 
reply to sender(sock, buf, &saddr, saddrlen); 
: 
return 0; 
; 
void reply to sender(int sock,char » msq,struct sockaddr in * addrp,socklen t len) 


{ 
char reply| BUFSIZ + BUFSIZ]; 


sprintf(reply, "Thanks for your * d char message\n", strlen(msg)); 
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sendto(sock, reply, strlen(reply), 0, addrp, len); 
} 
void say who called(struct sockaddr in * addrp) 
| 
char host[ BUFSIZ ] : 
int port; 
get_internet_address(host , BUFS12Z, &port,addrp); 
printf(" from, & s; &d\n", host, port); 


发 送 者 程序 当然 也 要 改变 以 接收 应 答 。 这 作为 练习 由 读者 来 完成 。 
13.5.5 数据 报 小 结 


数据 报 是 从 一 个 socket 发 送 到 另 一 个 的 短 消 息 。 发 送 者 使 用 sendto 来 指定 消息 .长度 
和 目的 地 。 接 收 者 使 用 recvfrom 接收 消息 。 数 据 报 和 带 有 地 址 的 Internet 上 传输 的 数据 包 
的 基本 结构 接近 .因此 ,数据 报 给 内 核 网 络 功能 和 网 络 流量 增加 的 负荷 较 少 。 由 于 数据 报 
可 能 在 传输 中 丢失 ,也 有 可 能 不 按 顺 序 地 到 达 , 所 以 它 道 常 用 对 简单 和 高 效 的 要 求 比 完整 性 
和 一 致 性 更 为 重要 的 应 用 中 。 

ee PRR AE OFS FERRI LR — 个 服务 器 来 接收 .处理 短 消息 和 发 
送 请 求 , 所 以 数据 报 是 一 个 合适 的 选择 。 


13.6 许可 证 服务 器 版 本 1.0 


下 面 , 回 到 许可 证 服务 器 项 目 上 来 。 这 里 的 服务 器 限制 了 程序 同时 运行 的 实例 数 日 。 
当 用 户 要 运行 爱 限制 的 程序 时 ,该 进程 要 向 服务 器 请 求 运行 许可 。 

如 果 并 没有 很 多 人 正在 用 该 程序 ,服务 器 发 送 票 据 给 进程 ,给 予 许可 征 。 如 果 达 到 了 了 有 最 
大 的 程序 实例 数 ,服务 器 发 送 无 可 用 票据 的 消息 给 客户 ,并 旦 通知 客户 稍 后 再 试 或 者 购买 支 
持 更 多 用 户 版 本 的 软件 。 被 许可 程序 和 服务 器 之 间 通 过 数据 报 来 通信 。 

客户 和 服务 器 的 运行 流程 及 其 交 五 过 程 刻 下。 


cint sry 





get tick 
do your 


wait for RO 
recv RO 
proc RO 
reply to RC 








work 
tet tick 
exit 





客户 和 服务 器 分 别 由 两 个 文件 组 成 : 得 的 文件 包含 main 消 数 ,长 的 文件 包含 票据 管理 
函数 。 下面 将 分 析 客 户 和 服务 器 程序 。 
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13.6.1 客户 端 版 本 1 


PRR HK KE RE KER ER REE N RE KEE KE EHH EH IE XE 
* leinti.c 

* License server client version 1 

x link with lclnt funcsl.o dgram.o 

xf 


# include < stdio, h> 


int main(int ac, char * av[]? 
1 
setup(); 
if (get ticket() f= 0) 
exit(d); 


do regular_work(); 


release ticket(); 


shut_down() ; 


} 


Pe ee 
* do regular work the main work of the application goes here 
ef 
do_regular_work() 
{ 
printf("SuperSleep version 1.0 Running - Licensed Software\n") ; 
sleep(10); /* our patented sleep algorithm «/ 


SPRNREBREBRT EPPA DNAR. e P8 LR HEAL. 
据 , 然 后 退出 。 该 许可 证 例 程 是 Unix 中 sleep 程序 的 特殊 版 本 , 若 不 满意 标准 sleep RAW 
工作 ,也 可 以 购买 许可 证 来 使 用 此 版 本 的 程序 。 当 然 还 要 运行 许可 证 服务 器 ,否则 该 sleep 
程序 将 指 弧 运行 。 其 中 辅助 昂 数 在 lclnt_funcsl.c rf. 


Preece ee eee See ee ee eee eee ee eee eee eee eee IR XC 
x Ielnt_funcsl.c, functions for tbe client of the license server 


x/ 


d include «stdio. h> 

d include <isys/types. h> 
# include < sys/ socket. h> 
# include <(netinet/ in. h> 
# include —netdb. h> 


ee i ee ce cco - T — T 
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Z * 


* Important variables used throughout 


x/ 
static int pid = -1; /* Our PID «/ 
static int sd = - 1; /* Our communications socket +/ 
static struct sockaddr serv acddr; fs Server address x/ 
static socklen t serv alen; /* length of address */ 
static char ticket buf[128]; /* Buffer to hold our ticket »/ 
static have ticket - 0; /* Set when we have a ticket «/ 
d define MSGLEN 128 /* Size of our datagrams x/ 
# define SERVER PORTNUM 2020 /* Our server’s port number =, 
+ define HOSTLEN 512 


4define oops(p) i perror(p); exit(1) ; } 
char * do transaction(); 


ix 
* setup, get pid, socket, and address of license server 
* IN no args 
* RET nothing, dies on error 
* notes; assumes server is on same host as client 
xf 
setupi) 
{ 
char hostname[ BUFS1Z] ; 


pid = getpidO; /* for ticks and msgs */ 
sd = make dgram client socket(); /* to talk to server x/ 
if (sd == -1) 


oops{ "Cannot create socket"); 
gethostname(hostname, HOSTT.EN); /* server on same host «/ 
make internet address(hostname, SERVER PORTNUM, &serv addr); 


serv_alen = sizeof(serv_addr) ; 


shut down() 
{ 
close(sd); 
j 
PRR EME X OX X KERR EORR ERK RR EMRE RE KER ARR EXE XX X XX ERE EMER REY 
* get ticket 
* get a ticket from the license server 
* Results; 0 for success, - 1 for failure 
xf 


int get_ticket() 
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char * response; 


char buf| MSGLEN :; 


if(have ticket) /* don't be greedy x/ 


return(0); 
sprintf(buf, "HELO $d", pid); /* compose request x*/ 


if ( (response = do transaction(buf)) == NULL) 


return( — 1); 


/* parse the response and see if we got a ticket. 
* on success, the message is; TICK ticket — string 


* on failure, the message is; FAIL failure - msg 


xf 

if ( strnemp(response, "TICK", 4) == 0 }{ 
strepy(ticket buf, response + 5); /* grab Licket - id »/ 
have ticket - 1; /* set this flag «/ 


. narrate("got ticket", ticket buf); 


return(0); 


if ( strnemp(responsc,"FAIL",4) == 0) 
narrate( "Could not get ticket", response); 
else 


narrate( "Unknown message;", response); 


return( — 1); 


| /x get ticket »/ 


JEGROGRG OR ee GER ENOXEOCEX XXE XX GOXOX OX X X Xo G3 OROXX MOX O9 X XL OX X XC X X00 X x X X Y X 
* release ticket 
x Give a ticket back to the server 
* Results, 0 for success, ~ 1 for failure 
*/ 
int release ticket() 
{ 
char buff MSGLEN |; 


char * response; 


| if(! have ticket) /* don't have a ticket x/ 


return(0); /* nothing to release x/ 
| sprintf(buf, "CBYE Xs", ticket buf); /* compose message x/ 
if ( (response = do transaction(bu()) == NULL) 


| return( - 1); 


/* examine response 


400 
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x success, THNX info string 

x failure; FATL error - string 

if ¢ strncmp{response, "THNX", 4) == 0) 
narrate( "released ticket OK", ""); 
return 0; 

1 

if ( strncmp(response, "FAIL", 4) == 0) 
narrate( "release failed", response t 5); 

else 
narrate( "Unknown message;", response); 


rcturn( - 1); 


} /* release ticket x/ 


JS ROCKS MOXOXCOEXCOEU ROLE XoxoX X &OX*X X X X X X X OX XX X X X X WW ox * X X OX X XEOX X KOX X Xx X OX OX xXx X ox 


* do transaction 


* 


x 


a 


* 


* 


Send a request to the server and get a response back 
IN msg p message to send 
Results, pointer to message string, or NULL for error 
NOTE, pointer returned is to static storage 


overwritten by each successive call. 


* note, for extra security, compare retaddr to serv addr (why?) 


xf 


char * do transaction(char # msg) 


i 


static char buf[MSGLEN]; 
struct sockaddr retaddr; 
socklen t addrlen = sizeof(retaddr); 


int ret; 


ret = sendto(sd, msg, strlen(msg), 0, &serv addr, serv alen); 
if ( ret -- - I 

Syserr("sendto"); 

return( NULL} ; 
} 
/* Get the response back #/ 
ret = recvfrom(sd, buf, MSGLEN, 0, &retaddr, Saddrlen}; 
if ( ret == -134 

syserr("recvfrom"); 


return( NULL) ; 


/* Now return the message itself «/ 
return(buf); 
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| /* do transaction */ 


eee eee ee eee eee ee ee ee ee ee ee ee ee ee ee 
x narrate: print messages to stderr for debugging and demo purposes 
x IN msgl, msg2 ; strings to print along with pid and title 
* RET nothing, dies on error 
x 
narrate(char x msgl, char * msq2) 
1 
fprintf(stderr, "CLIENT | $d]; &5 %s\n", pid, msgl, msg2); 
H 
syserr(char * msgl) 
d 
char buf[ MSGLEN | ; 
sprintf(buf, CLIENT [ $d]: $s", pid, msgl); 
perror(buf): 
} 


get ticket 和 release ticket RB PHM ER RRM. EMA UR T HU ER]. 产生 短 请 
求 ,发送 消息 给 服务 器 .等待 服 务 器 的 应 答 , 然 后 检查 应 答 和 根据 应 答 采 取 行 动 。 

get ticket 通过 发 送 命令 HELLO 以 及 紧 跟 其 后 的 PID 来 请 求 票据 。 服 务 器 通过 发 送 
TICK ticket-id Èk. AR BRIE FAIL explanation 拒绝 请 求 。 

release- ticket 通过 发 送 命令 GBYE ticker -id 返回 票据 。 如 果 票 据 蚌 合法 的 ,服务 器 将 
Rik THNX greeting 消息 作为 应 答 。 如 果 票 据 不 合法 ,服务 器 发 送 FAIL explanation 消息 。 

为 何 更 据 可 能 是 不 合法 的 ? 本 文 的 后 面 将 讨论 该 问题 ， 


13.6.2 服务 器 端 版 本 1 


[RAKE RMR ERE RMR HH RE ENE X oX oA o3 X 4 X Xx XX 0€ X HKH XX XX X X036 EX X XXX XX X X X o OX X X X X 
* lservi.c 
* License server server program version 1 


x 


i include <stdio.h> 

# include < sys/types. h> 
H include  «sys/socket. h> 
H include «Z netinet/in. h> 
# include «signal. h> 

# include =<Zsys/errno. k> 


# define MSGLEN 128 /* Size of our datagrams x/ 


int main(int ac, char » av[]) 
i 
struct sockaddr_in client addr; 


socklen t addrlen = sizeof(client addr); 
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char buf[MSGLEW ; 
int ret; 
int Sock; 


sock = setup(); 


while(1) | 
addrlen = sizeof(client addr); 
ret = recvfrom(sock,buf,MSGLEN,D,&client addr,&addrlen); 
if(ret!- -1 4 
bufi ret] = '&0'; 
narrate("GOT.", buf, &client_addr); 
handle request (buf ,&client_addr addrlen) ; 
; 
else if ( errno ! = EINTR } 


perror( "recvfrom"); 


VERD WAR 3928 B9 SRE TER ,主要 包括 接收 客户 请 求 , 处 理 请 求 和 发 送 应 答 ， 其 
中 处 理 请 求 的 代码 包含 在 lserv_funcsl.c 文件 中 。 


PRR RMS RRR MERE RR MERE MERE MRR ERR HE REHM NKR RR EERE KKH KEK K ERE HE 


* lerv funcsli.c 
* functions for the license server 


x, 


H include  «stdio.h-- 

# include  «sys/types. h> 
# include «l sys/ socket. hi> 
f include <Cnetinet/ in. h> 


# include «l netdb. h> 





# include «signal. b> 


H#include  «sys/errno.h7- 


# define SERVER PORTNUM 2020 /* Our server's port number */ 
+ define MSGLEN 128 /* Size of our datagrams */ 

# define TICKET AVAIL Q /* Slot is available for use x/ 
# define MAXUSERS 3 /* Only 3 users for us */ 


# define cops(x) { perror(x); exit( — 12; | 


JUNGE EX OE OX OEC EGO ECOLE XXX XXX eee ee eee eee ee 


x Important variables 


f 


x/ 
int ticket array[MAXUSERS]; /* Dur ticket array «/ 
intsd = -1; /* Our socket x/ 


I 
e 


int num tickets out /* Number of tickets outstanding x/ 


第 13 章 EFRR Datagram HRE: 编写 许可 证 服务 器 2 * 403 








char * do hello(); 
char + do goodbye(; 


SRE RKRE RHR RK AHHH EMH HRN RK RH NO SC EI E E d d X X X MOM og X XO X X XX X X HE RHEE 
* setup() 一 initialize license server 

Xr 

setup() 


! 
i 


sd = make dgram server socket(SERVER PORTNUM); 
if (sd == -1) 
oops( "make socket"); 
free all tickets(); 
return sd; 
} 
free all tickets) 
i 


int i; 


, 


for(i-0; i«;MAXUSERS; i++) 


ticket array[i] - TICKET AVAIL; 


HIZIZITIISEEIIIIIDLSEZEZZRSIIEZSISIESSEISSISSIEISIDSSSSSSSSESEEEI 
* shut down() — close down license server 
x/ 
shut down() 
close(sd); 


| 


eee CC eee CeCe ee ee ee eee 
* handle request(request, clientaddr, addrlen) 
* branch on code in request 
*/ 
handle request(char x req,struct sockaddr in * client, socklen t addlen) 
{ 
char * response; 


int ret; 


/* act and compose a response #/ 

if ( strnemp(req, "HELO", 4) == 0) 
response = do hello(req); 

else if ( strncmp(reg, "GBYE", 4) == 0) 
response = do goaodbye(req); 

else 


response = "FAIL invalid request"; 
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/* gend the response to the client +/ 


narrate( "SAID," 


ret = sendto(sd, response, strlen(response),0,client, addlen); 


, response, client); 
if (ret == -1) 
perror( "SERVER sendto failed"); 


jee X XX X HE KEV X X X X X X X X X X X X X 0X X dX GR X X 3X XX X X03 X X X X X KR E & & OX XX X X X KOX WOX X Xo* X oko» 
* do hello 
* Give out a ticket if any are available 
» IN msg p message received from client 
* Results; ptr to response 
* Note. returnis in static buffer verwritten by each call 
* NOTE, return is in static buffer overwritten by each call 
4 7 
char * do hello(char * msg p) 
4 
int X; 


static char replybuf[MSGLEN!; 


if(num tickets out > = MAXUSERS) 
return("FAIL no tickets available"); 


/* else find a free ticket and give it to client */ 
for(x = 0; x< MAXUSERS && ticket array[x] |= TICKET AVAIL; x++) ; 


/* A sanity check — should never happen »/ 
if(x == MAKUSERS) { 
narrate( "database corrupt", "", NULL); 
return "FAIL database corrupt"); 


/* Found a free ticket. Record "name" of user (pid) in array. 
x generate ticket of form; pid. slot 
»/ 
ticket array[x] = atoi(msg p ! 5); /* get pid in msg x/ 
sprintf(replybuf, "TICK *d. ¢d", ticket array| x], x); 
num tickets out ++ ; 
return(replybuf); 
| /* do hello «/ 


GURGECEOMOK OX CX A OXOX X X d GO X CX OEC EXEC ee ee ee ee ee ee ee ee ee ON EXE X 
* do goodbye 

* Take back ticket client is returning 

* IN msg p message received from client 


* Results; ptr to response 
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x Note, return is in static buffer over written by each call 
" 
char * do qeodbye(char x msg p? 
i 
int pid, slot; /* components of ticket */ 


/* The user's giving us back a ticket. First we need to get 
* the ticket out of the message, which looks like, 
m 
» GBYE pid. slot 
*/ 
if((sscanf((msg p + 5), "d. %d", &pid, &slot} | = 2) | 
(ticket array[slot] != pid}) : 
narrate("Bogus ticket", msg p * 5, NULL); 
return( "FAIL invalid ticket"); 


à 
5 
i 


/* The ticket is valid. Release it. x/ 
ticket array|Slot] = TICKET_AVAIL; 


num bickets out-- ; 


/* Return response x/ 
return( "THNX See yal"); 
) /* do goodbye »/ 


ee ee ee ee CORE GRE Ee x o EX HERR EK EERE * 
x narrate() — chatty news for debugging and logging purposes 
xf 
narrate(char x msgl, char x &sq2, struct sockaddr in * clientp) 
{ 
fprintf(stderr, AtXtSERVER. ts $s", msgl, msg2); 
if ( clientp ) 


fprintf(stderr,"( ts; &d)",inet ntoa(clientp- :-sin addr), 


ntohs(clientp- —sin port? ); 
putc("An', stderr}; 


3 个 重要 的 函数 解释 如 下 。 

(1} handle request 

请 求 由 4 个 字符 的 命令 带 TERM. RERARAAS :然后 调用 对 应 的 函数 。 即 
使 命令 不 合法 ,服务 器 也 必须 发 送 应答 ,否则 客户 会 一 直 阻 塞 下 去 。 

(2) do, hello 

HELO 命令 用 米 请 求 票 据 。 服 务必 查找 票据 数组 寻找 空间 的 项 。 如 果 某 项 的 PiD 值 为 
0, 表 示 这 是 一 个 可 用 票据 。 服 务 器 使 用 独立 的 变量 num, tickets, out 来 节省 时 间 。 服 务 器 
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接收 请 求 后 ,可 以 通过 查找 表 米 寻找 空闲 项 ,而 该 变量 可 以 措 明 和 何 时 表 已 经 满 了 ,这 样 就 不 
必 做 查找 了 ， 

(3) do_goodbye 

GBYE 4 BiB SNR. A -AH PID AR aS ROSE AR 
将 票据 的 PID 和 票据 编号 与 签 出 列表 (sign-out list) 中 的 值 进 行 比较 ,如 果 数 据 一 致 ,服务 
器 从 签 出 列表 中 清除 该 项 的 值 并 日 致 谢 客 户 。 如 果 不 一 致 , 则 一 定 是 什么 地 方 发 生 了 错误 。 

如 果 你 是 飞机 场 的 检票 员 ,如果 基 个 客户 给 出 存根 的 编导 和 名 字 在 数据 库 中 不 存在 ,你 
就 可 能 会 问 ,“ 你 是 从 哪里 得 到 这 张 票 的 ,你 是 谁 ”” 后 面 将 讨论 伪造 票 括 问 题 。 下 面 来 测试 
这 个 版 本 的 程序 。 


13.6.3 测试 版 本 1 
编译 服务 器 端 程序 并 在 后 台 运 行 它 。 








& cc lservi.c lserv funcsl,c dgram.c - o isarvl 
$ ./lservl& 
[1] 25738 


编译 好 客户 端 程序 ,然后 同时 运行 4 PB 


$ ee lelnti.c lelnt funcsi.c dgram.c - o lelnti 
$ ./iclntl&./lclnt] &£./lclnt] &. /lclnt] & 


SERVER; GOT; HELO 25912(10. 200.75. 200.1053) 
SERVER: SAID, TICK 25912. 0(10. 200. 75. 200,1053) 

CLIENT[259127.got ticket 25912.0 

SuperSleep version 1. 0 Running Licensed Software 
SERVER; GOT, HELO 25913(10. 200. 75. 200.1054) 
SERVER. SAID, TICK 25913.1(10. 200. 75, 2001054) 

CLIENT[259313];got ticket 25913.1 

SuperSleep version 1.0 Running - Licensed Software 
SERVER : GÖT: HELO 25315(10.200. 75. 200,1055) 
SERVER ; SAID, TICK 25915. 210.200. 75, 200,1055) 

CLIENT[ 25915 |: got ticket 25915, 2 

SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT: HELO 25914(10. 200. 75. 200,1059) 
SERVER: SAID; FAIL ne tickets available (16. 200.75. 200.1059) 

CLIENT: 25914_ :Could not get ticket FAIL no tickets available (10. 200.75, 200,1059) 
SERVER: GOT; GBYE 25912.0(10, 200. 75. 200,1053} 
SERVER, SAID, THNX See ya! (10. 200.75, 200.1053) 

CLIENT 25912]: released ticket OK 
SERVER; GOT; GAYE 25913, 1(10. 200, 75. 200.1054) 
SERVER, SAID, THNK See ya! (10. 200.75. 200.1054) 

CLIENT[ 25913]: released ticket OK 
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SERVER: GOT: GBYE 25915.2(10, 200. 75. 200;1055) 
SERVER; SAID; THNX See ya! (10. 200.75. 200; 1055) 


CLIENT?25915 .released ticket OK 


实际 运行 的 程序 可 能 有 非常 不 同 的 结果 。 尽 管 如 此 .从 中 可 以 看 到 服务 器 如 何 接收 请 
或 .给 出 票据 以 及 客户 端 如 何 获取 票据 并 开始 工作 的 ; 可 以 看 到 进程 25914 BUS 5E 9I E. 
因为 在 该 进程 出 现时 ,所 有 的 票据 蹇 已 经 第 占用 了 ,而 之 前 进程 25915 AGB SSRN 


如 果 运 行 该 程序 多 次 ,可 能 会 看 到 不 同 的 结果 。 
13.6.4 进一步 的 工作 

版 本 1 的 许可 证 服务 其 可 以 很 好 地 工作 了 ， 服务 器 处 田 请 求 并 且 维 持 持 有 票据 的 进程 
列表 、 客 户 可 以 从 服务 器 得 到 票据 。 现 在 为 止 一 臣 都 正常 。 和 看 起 来 这 非常 理想 。 不 过 现实 
世界 并 不 总 这 样 美好 .软件 及 其 使 用 者 并 不 完 企 是 你 所 期 望 的 那样 。 可 能 出 珊 什 么 错误 呢 ?， 


该 如 何 处 理 这 些 错 误 呢 ? 
13.7 ”处理 现实 的 问题 


这 里 的 许可 证 服务 器 能 很 好 地 工作 .前提 是 所 有 的 进程 是 正常 工作 的 。 有 时 .软件 可 能 
运行 出 错 。 如 果 SuperSieep 程序 被 男 外 一 个 用 户 杀 死 了 ,或 者 程序 发 生 段 存 取 错误 而 被 内 
核 共 死 了 .该 如 何 呢 ? 对 于 它 所 占用 的 票据 该 如 何 处 理 呢 ?如果 服务 器 月 浊 了 怎么 呢 ? 在 
服务 器 重启 后 又 将 发 生 什么 呢 ? 

现实 世界 中 的 程序 必须 能 够 处 理 异 常 户 汗 。 这 里 考虑 丙种 情形 : 客户 端 岂 省 和 服务 器 


DIYS, 
13.7.1 ABBA wea 
NRE Pie EA dE PUER RD EE , mE 13. 8 所 示 。 


E 


<= 


-] 签 出 列表 中 死 进 


程 对 应 的 条 目 








iR AERA UG 
将 不 会 返回 票据 i 





图 13.8 客户 不 归还 票据 


在 出 租车 公司 里 MATERE AERE . 回 家 或 死亡 ,但 仍 持 有 公司 轿车 的 钥匙 。 这 些 
对 公司 将 造成 什么 影响 呢 ? 签 出 列表 指明 票据 仍 锌 占 用 。 其 他 进程 就 不 能 得 到 该 票据 。 但 
是 ,如 采 有 是 够 多 的 进程 朋 溃 . 签 出 列表 不 可 能 虽然 满 了 ,但 此 时 却 没有 运行 的 客户 程序 ， 

钥匙 莹 理 员 通 过 给 持 有 钥匙 的 人 打 电 话 ,就 可 以 收回 钥匙 。 他 可 以 定期 地 浏览 签 出 列 
六 ,然后 给 每 个 司机 打 电 话 ，“ 你 仍 在 使 用 车 鸣 ?。 如 果 无 人 响应 ,管理 员 把 他 的 名 字 从 私 出 
RPA. 管理 员 检 查 的 频率 越 高 , 签 出 列表 的 精确 性 就 越 高 。 
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许可 证 服务 器 可 以 使 用 相同 的 技术 .定期 检查 票据 数组 .确认 其 中 的 每 个 进程 是 否 还 活 
aio 如 果 某 个 进程 已 经 不 存在 了 ,服务 器 可 以 把 该 进程 从 数组 中 去 内 ,释放 其 占用 的 票据 ， 
检查 程序 运行 的 越 和 频繁, 数组 的 精确 性 越 遍 。 

1. 收回 丢失 的 景 据 : BE 

服务 器 中 如 何 增加 收回 票据 的 代码 ? 如 何 调用 这 些 人 代码 ? 服务 器 必须 实现 两 个 独立 的 
操作 : 等 待 客户 的 请 求 , 同时 周期 性 地 收回 丢失 的 票据 。 而 调度 行为 是 简单 的 : 只 要 使 用 
alarm 和 signal 技术 来 周期 地 调用 一 个 函数 ,在 前 面 章节 的 移动 文字 例子 中 ,使 用 了 这 种 技 
术 。 修 订 的 程序 流程 如 图 13. 9 Prax. 
















sm 
1 _main() 2 
Se d ER cios 
loop= .— 
in | 0 ——— 
— Au Dems a ticket reclsimi) _ 
BL Li rcr [pes ATTE cave | 
RUE E Eu eki no liner minvm-- inerme | 
— E HT rfe 1a r- > | 
- | 


l 图 13.9 (ŒH wlarm 来 调度 票据 消除 程序 


在 设计 需 同 时 处 理 两 件 事情 的 程序 时 ,必定 要 考虑 机 数 之 出 的 冲突 。 如 果 服 务 器 正在 
处 理 客户 请 求 的 同时 ,被 SIGALAM 信号 触发 油 用 同 收 丢失 的 桂 据 的 酒 数 , 会 产生 问题 吗 ? 
这 两 个 处 理 测 数 共 从 变量 或 者 数据 结构 蚂 ? 显然 是 的 ,发 放 票 据 需 浊 修 改 签 出 列表 ,出 收回 
票据 也 需要 修改 稚 出 列表 。 这 种 冲突 可 能 会 破坏 数据 的 一 致 性 吗 ? 该 问题 留 作 课 后 练习 。 
考虑 到 安全 性 ,在 处 理 请 求 的 时 候 关 闭 alarm, 

2 MEEK OBA. 编程 

服务 器 希望 能 回收 已 经 不 存在 进程 的 票据 。 OA Mol HE Je dm dede EO 可 以 使 
用 popen 来 运行 ps, 然 后 从 ps 的 输出 中 查找 PID, 以 确定 持 有 票据 的 PID 是 否 存 在 。 另 一 
种 快速 简洁 的 方法 是 使 用 kiti 系统 调用 的 特 跌 功能 。 

可 以 通过 给 进程 发 送 编号 为 0 的 信号 以 确定 它 是 否 存 在 。 如 昌 进 程 不 存在 ,内 被 将 不 会 
发 送信 生 ,而 是 返回 错误 并 设置 errno y ESRCH, 7E ticket reclaim 中 使 用 了 该 特征 ,该 函 
WE lserv_funcs2.c 文件 中 : 


# define RECLAIM INTERVAL 60 /* reclain every 60 seconds «/ 
EEEE E OEE ERNE NHN RK RRR RAR PN OR ee a 外 
ticket ceclaim 
* go through all tickets and reclaim ones belonging to dead processes 
x Results, none 
a/ 
void ticket reclaim() 


l 








138 基于 数据 报 {Datagram) 的 编程 METERS HR- + 409 * 





int i; 
char tick[BUFSIZ]; 
for(i = 0; i < MAXUSERS; itt ) | 
if((ticket array| i] ! TICKET AVAIL) && 
(kill(ticket array[i;, 0) == - 1) && (errno == ESRCH)) | 
/* Process is gone — free up slot */ 
sprintf(tick, "%d. $d", ticket_array[i],i); 
narrate{ "freeing", tick, NULL); 
ticket array|i? = TICKET AVAIL; 


num tickets out -- ; 


} 
alarm(RECLAIM INTERVAL); /* reset alarm clock x/ 


H 
! 


接 下 来 ,在 main 函数 中 增加 调度 回收 票据 的 函数 ,并 在 正常 操作 中 关闭 alarm, HA 
的 main 在 文件 Iserv2. c 中 ， 


int main(int ac, char x av| ]) 
{ 
struct sockaddr client addr; 
socklen t addrlen- sizeof(client_addr) ; 
char buf| MSGLEN | ; 
int ret, sock; 
void ticket reclaim(); /* version 2 addition */ 


unsigned time left; 


sock = setup(); 


signal (SIGALRM, ticket reclaim); /* run ticket reclaimer x/ 
alarm(RECLAIM INTERVAL), /* after this delay «/ 
while(1} { 


addrlen = sizeof(client addr?; 

ret = recvfrom(sock,buf,MSGLEN,O,&client addr,&addrlen); 
if (ret l= -1X 

buf[ ret] = '"\Q'; 

narrate("GOT,", buf, &client addr); 

time left = alarm(0); 

handle request(buf,&client addr,addrlen); 
alarm(time left); 

} 

else if ( errno | = EINTR ) 

perror( "reevfrom"} ; 


} 
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通过 上 而 的 修改 ,许可 证 服务 器 就 可 以 周期 性 地 检查 票据 了 。 确 实 需 要 这 样 周 期 性 地 
从 查 吗 ”为 什么 素 只 在 票 失 列表 满 了 并 且 有 客户 的 请 求 被 拒绝 的 时 候 检 查 呢 ?这 样 会 更 
H8 
13.7.2 处 理 服 务 器 崩溃 

IR 5$ SHRM AM SP wd ag. 首先 , 签 出 列表 丢失 .失去 进程 皖 有 票据 的 记录 。 
其 次 ,新 客户 不 可 以 再 运行 ,因为 分 发 寿 可 证 的 程序 已 经 木 存在 。 最 简单 的 解决 方法 是 重新 
启动 服务 器 .如 图 13.10 所 示 。 


先前 服务 器 
LEE 





新 启动 的 服 
aaa. MB 


列 | Be Fa Oy 
Na ju 





图 13.10 ARB As te HB 9 Bea 


TARA 288545 Br 865 e) Te IB ae IE A a fe 

B6 HIG TAS de 09 EE Ss WS 8 x E OAR BOGE 0 SUR TUE. HS ULT DR 
H dE SSH CAE UT E C AR T som RJ UL 28 0 ACE PRK, RR et BR 
5$ ds BE CI HR S a [ED EE EL— FE V] DA j7 ^E WC A83 2E, 

其 次 REA TASS I BAY) 38 JE 0) E P VEU ER DELLI] .将 会 被 认为 是 伪造 票据 ，。 

l, 票据 验证 

上 述 问题 的 一 个 解 央 方法 是 票据 验证 。 真 所 验证 表示 每 个 客户 周期 性 地 向 服务 器 发 送 
际 据 的 副本 。 客 户 发 送 数 据 包 ,对 服务 器 说 ;“" 这 是 我 的 票据 是 合法 的 碍 ?”, 如 图 13.141 
Mm. 











Bini) 客户 验证 票据 


RS AR eS AM PID。 服 务 器 检查 签 出 列表 。 如 果 该 项 为 空 ,服务 器 可 以 认为 该 
票据 是 自己 先前 的 实例 赋予 的 。 服 务 器 将 会 到 该 票据 加 到 列表 中 。 逐 步 地 ,客户 提供 票据 
来 验证 , 签 出 列表 被 重新 填 人 。 

服务 器 重建 签 出 列表 解决 了 表 竺 失 问 题 . 但 可 能 导致 其 他 问题 。 如 果 一 个 新 的 客户 在 
宕 重建 好 之 前 ,请 求 票据 ,服务 器 可 能 分 发 一 个 已 经 给 子 其 他 窜 户 的 票据 给 该 客户 。 当 持 有 
旧 的 票据 的 客户 对 其 票据 进行 验证 时 ,服务 器 会 拒绝 它 。 





13 MFR (Datagram 98 B2. fe 7S VERD ERS » Alls 





另 一 种 方法 是 服务 器 拒绝 表 中 没有 的 所 有 的 球 据 。 持 有 被 拒 票 据 的 客户 尝试 再 申请 新 
的 。 这 种 方法 是 否 更 好 ? 

2. 协议 中 增加 验证 

不 据 验证 是 协议 中 的 一 个 新 的 事务 

CLIENT; VALD tickid 

SERVER , GOOD or FAIL invalid ticket 


这 里 必须 改变 客户 和 服务 器 以 支持 验证 。 
3. BP ik po it 
客户 端 增加 验证 .需要 编写 一 个 函数 并 在 主 钢 数 中 调用 它 , 其 流程 如 图 13. 12 所 示 。 








HELO pido 
A——— TICE tickid 


GBYE tickid———e 


























图 13.12. X Pise pue ur RE 


客户 可 以 根据 系统 的 需要 以 一 定 的 间隔 定期 验证 票据 ,可 以 设置 一 个 计时 器 来 定期 验 
证 。 如 果 客 户 是 一 个 电子 制 玫 程序 ,验证 可 以 在 一 定量 的 计算 结束 后 进行 。 一 个 许可 证 服 


务 器 会 响应 验证 请 求 。 
SuperSleep 客户 程序 可 以 把 10 秒 的 睡眠 时 间 分 割 成 两 个 5 秒 , 在 这 期 间 进 行 验证 。 这 
作为 课 后 练习 。 


4. ALS & 3 SS ho Ke ie 
服务 器 端 增加 验证 需要 做 两 处 改动 。 改动 后 的 程序 位 于 新 的 文件 lserv_funcs2, c P. 
首先 ,增加 一 个 消 数 玉 验 证 票据 : 


JR ALLEM EPPS eet. eee eek e eee ee eee ee ee eee NAE 
x do_ validate 
x Validate client's ticket 
x IN msg p message received from client 
* Resuits: ptr to response 
x NOTE. return is in static buffer overwritten by each call. 
*/ 
static char x do validate(char x msg) 
{ 
int pid, slot; /* components of ticket x/ 


/* msg looks like VALD pid. slot - parse it and validate »/ 
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if (sscanf(msg + 5," & d. $ d", &pid,&slot) 722 && ticket array[slot! == pid) 
return( "GOOD Valid ticket"); 


/* bad ticket «/ 
narrate("Bogus ticket", msg + 5, NULL): 
returnt "FAIL invalid ticket"); 

} 


其 次 ,handie_request 中 增加 更 多 的 判断 ， 


handle request(char x req,struct sockaddr in * client, socklen t addlen) 
1 


char * response; 


int ret; 


/* act and compose a response x/ 


if ( strnomp(req, "HELO", 4) == 0) 
response = do hello(req); 

else if ( strncmp(req, "GBYE", 4) == 0) 
response = do goodbye(req); 

else if ( strnomp(reg, "VALD", 4) == 0) 


response = do validate(req); 
else 


response = "FAIL invalid request"; 


/* send the response to the client «/ 
narrate( "SAID.", response, client); 
ret = sendto(sd, response, strlen(response),0, client, addlen); 
if ( ret == -1) 
percror( "SERVER sendto failed"); 


13.7.3 测试 版 本 2 


现在 可 以 编译 和 测试 新 版 本 的 客户 和 服务 器 了 。 测 试 包含 了 杀 死 客户 和 服务 器 以 及 重 
局 客户 和 服务 器 。 试 观察 输出 中 的 进程 ID 和 消息 。 为 了 便于 测试 ,客户 睡眠 时 间 为 两 个 15 
DIIS EE E E EISE 秒 尝试 回收 票据 。 结 果 如 下 ， 


$ cc lserv2.c lserv funcs2.c dgram c - o lserv2 


$ cc lelnt2.c lolnt funcs2.c dgram.c - o lclnt2 


$ ./lserv2k inu ides 
[1]30804 
$ ./lclnt2&./lclnt2&./lclnt2&£ d 6s3 7 Pw 
[2130805 


[3130806 


一 一 一 一 一 











第 13 章 基于 数据 报 CDatagram) 的 编程 : 编写 许可 证 服务 器 他 . 413 s 
[4 ]30807 
5 SERVER. GOT; HELO 30805 (10. 200.75.200-1085) 
SERVER, SAIN; TICK 30805. 0 (10. 200. 75. 200,1685) 
CLIENT [30805 ] :got ticket 30805.0 
SuperSleep version 1,0 Running - Licensed Software 
SERVER, GOT; HELO 30806 ¢€10. 200.75, 200,1086) 
SERVER: SAIN, TICK 30806. 1 (10. 200.75. 200,1086) 
CLIENT [30806,,:got ticket 30806. 1 
SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT. HELO 30807 (10.200.75.200,1087) 
SERVER; SAID, TICK 30807.72 (10.200.75.200,1087) 
CLIENT [30807 ];got ticket 30807.2 
SuperSieep version 1.0 Running - Licensed Software 
8 kill30806 kill 一 个 客户 
[3]- Terminated . /1clnt2 
SERVER; freeing 30806. 1 
SERVER: GOT, VALD 30805.0 (10.200. 75, 200-1085) 
SERVER. SAID. GOOD Valid ticket (10. 200.75, 200,1085} 
CLIENT [30805], Validated ticket. GOOD Valid ticket 
SERVER, GOT . VALD 30807.2 (10.200.75.200,10875 
SERVER; SAID, GOOD Valid ticket (10.200.75.200,1087) 
CLIENT [30807], Validated ticket; GOOD Valid ticket 
$ kill30804 #kill 服务 器 


[1 {Terminated , flserv2 

$ ./iserv& 6 Gam eR 
[530808 

$ 


SERVER: GOT, GBYE 30805.0 (10.200. 75. 200; 1085) 

SERVER, Bogus ticket 30B05.0 

SERVER; SAID, FAIL invalid ticket (10.200. 75.200.1085) 
CLIETN[30805].release failed invalid ticket 

SERVER.GOT, GBYE 30807.2 (10.200.75.200,1087) 

SERVER. Bogus ticket 30807.2 

SERVER, SAID, FAIL invalid ticket (10.200.75.200,10875 
CLIETN[ 30807 |: release failed invalid ticket 
$ ./lclnt2 $a -个 新 的 客户 

SERVER; GOT; HELO 30809 (10,260.75. 200 :10857 

SERVER; SAID, TICK 30805. 0 (10. 200.75. 200.1087) 
CLIENT ( 30809]1.,got ticket 30809. 0 
SuperSleep version 1,0 Running - Licensed Software 

SERVER, GOT . VALD 30809. 0 (10. 200. 75.200.1087) 

SERVER, SAID, GOOD Valid ticket (10.200.75.200.10875 
CLIENT [30809 !. Validated ticket, GOOD Valid ticket 

SERVER: GOT, GBYE 30809,0 (10.200. 75, 200.1087) 
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SERVER, SAID, THNX See ya! (10.200. 75.200;,1087) 
CLIENT [30809 ],release ticket OK 


[2] Done . /Aclnt2 
[4]- Done . /1clnt2 
$ Ps 

Pin TTY TIME CMD 


23509 pts/3  00;00,00 bash 
30808 pts/3 00,00:00 1serv2 
30810  pts/3 00.00,00 ps 

$ 


BRRAAS. PA TEREF .观察 其 中 的 交互 过 程 。 


13.8 ”分布 式 许可 证 服务 器 


许可 证 服务 大 和 被 许可 程序 通过 socket 进行 通信 ，socket 可 以 连接 不 同 主机 上 的 进程 。 
理论 上 ,与 Web 服务 器 和 客户 运行 在 不 同 主机 上 类 似 , 这 里 的 客户 可 以 运行 在 一 台 机 器 上 。 
而 服务 器 运行 在 另 一 台 机 器 上 。 当 它们 运行 在 不 同 的 机 器 上 时 ,会 有 问题 蚂 ? 是 的 。 

- HEL: 重复 的 进程 ID 

进程 ID 在 一 台 机 器 上 是 惟一 的 ,但 在 不 同 主机 上 的 进程 可 能 拥有 相同 的 进程 D. B 
13. 13 涪 明 的 情况 不 含有 任何 错误 上 且 很 常见 ， 


许可 证 服务 器 








13.13 ERZ PID 不 惟一 


RBI PSA PID MBS, 4A 13. 13 的 情况 中 ,许可 证 服务 将 认为 给 同 
一 个 进程 分 配 了 3 张 票 。 每 个 进程 只 要 一 张 票 就 可 以 运行 ,所 以 这 是 错 误 的 。 请 求 更 多 的 票 
据 , 可 以 被 认为 是 客户 端的 一 个 漏洞 。 

这 里 可 以 扩展 票据 表 项 的 格式 和 内 容 ,使 其 包含 标识 运行 程序 的 主机 从 而 解决 重复 PID 
问题 。 

。 和 问题 2; 回收 票据 

服务 器 道 过 调用 kill(pid,0) 命 令 向 客户 回收 票据 。kill(pia, 0) 发 送信 号 0 给 持 有 票据 
的 进程 。 通 过 修订 过 的 票据 表 , 服 务 器 现在 可 以 知道 客户 运行 在 哪 台 主 机 上 。 

但 是 .服务 器 不 能 给 其 他 机 器 上 的 进程 发 送信 号 ,如 图 13.14 所 示 。 如 果 许 可 证 服务 器 
想 给 主机 3 上 的 进程 发 送信 和 号 ,服务 器 必须 产生 主机 3 上 的 请 求 。 











图 13,14 进程 不 能 给 其 他 主机 发 送信 和 号 


为 什么 不 在 每 台 机 器 上 都 运行 一 个 服务 器 的 实例 ”如 图 13. 15 所 示 :每 个 本 地 的 服务 
er n] LANCER E ARR. 
许可 证 服务 器 评 可 证 服务 器 ”许可 证 服务 器 





13.15. 运行 本 地 复制 的 lserv 


本 地 服务 器 解决 了 向 主机 发 送信 号 的 问题 ,但 是 又 带 来 新 的 问题 ; 哪个 服务 器 发 布 票 
据 ? 主 服 务 器 如 何 和 本 地 服务 器 通信 ? 客户 把 票据 发 给 谁 验 证 ? 

* 问题 3: SHA 

如 果 其 中 的 一 台 机 器 停止 运行 ,将 会 发 生 什 么 ” 主 服务 器 如 果 还 在 运行 的 话 , 和 如何 收回 
票据 ?客户 端 程序 如 何 验 证 票据 ”如果 运 行 主 服务 器 的 主机 停止 运行 , 谁 来 分 发 票据 ? 

如 和 何 建立 一 个 分 布 式 许可 证 系统 来 同时 支持 多 台 机 器 ”这 里 有 3 种 方法 。 试 考虑 它们 
的 设计 细节 以 及 优 缺 点 .并 考 巧 当 容 广 、 服 务 器 .计算 机 或 者 网 络 崩 注 时 每 个 方案 的 后 沫 。 

。 HHI: 客户 端 服务 器 和 中 央 服 务 器 通信 

每 台 机 器 都 有 一 个 本 地 服务 器 ,就 像 本 文 编写 的 那样 。 每 个 客户 跟 本 地 的 服务 器 通信 ， 
本 地 服务 器 把 请 求 转 发 给 中 央 服 务 器 。 中 央 服 务 器 返回 票据 或 者 拒绝 .本 地 服务 器 记录 并 
把 应 答 转 发 给 客户 。 本 地 服务 器 也 可 以 强制 执行 一 些 对 本地 客户 的 限制 .例如 该 机 器 上 可 
以 运行 的 程序 实例 数 .或 者 程序 可 以 运行 的 时 刻 。 

+ 方法 2: 每 个 客户 都 和 中 央 服 务 器 通信 

客户 直接 给 特定 主机 上 的 服务 器 发 送 请 求 。 本 地 服务 狼 运 行 在 每 个 主机 上 ,但 这 些 服 
务 占 不 各 窜 户 通信 ,它们 在 重新 声明 票 所 的 时 候 作 为 中 央 服 务 器 的 代理 。 

， 方法 3: 客户 服务 器 和 客户 服务 器 通信 

每 台 届 器 都 有 本 地 服务 器 ,每 个 客户 跟 本 地 服务 器 通信 。 没 有 中 央 服 务 器 。 所 有 的 本 
地 服务 齐 问 互相 通信 。 每 次 一 个 客户 请 求 时 ,本 地 服务 器 询问 其 他 所 有 的 服务 器 目前 已 又 
用 乔 了 多 少 张 票 。 如 果 所 用 票据 数 小 于 所 允许 的 总 数 . 本 地 服务 器 分 归 一 张 票 据 给 客户 。 








ae a ae Unix/Linux 编程 实践 教程 








13.9 Unix WẸ socket 


本 章 的 许可 证 服务 器 中 的 socket 使 用 标准 的 主机 ID 和 端口 号 地 址 系统 。 使 用 这 些 
Internet 地 址 ,服务 器 可 以 接收 本 地 的 乃至 更 大 网 络 上 机 器 的 客户 请 求 。 

在 上 述 的 丙种 分 布 式 洗 可 证 服务 器 模型 中 ,客户 只 需 和 同一 台 主 机 上 的 服务 器 通信 。 
socket 只 能 用 在 仪 限 于 主机 内 部 的 通信 中 玛 ? 


13.9.1 文件 名 作为 socket 地 址 


有 两 种 连接 : 流连 接 和 和 数据 报 连 接 , 也 有 两 种 socket 地 址 : Internet 地 址 和 本 地 地 址 。 
Internet 地 址 包含 主机 ID 种 端口 和 号。 本 地 地 址 通常 叫 居 Unix 域 地 址 , 它 是 -- 个 文件 各 {《 例 
贡 /dev/log、/dev/printer z/tmp/lserversock) ,没有 主机 和 端口 叶 。 

两 个 socket 4 /dev/log 和 /dev/printer 被 用 在 很 多 Unix 系统 中 。/dev/log 被 syslogd 
服务 右 所 使 用 。 想 些 记 录 日 志 的 程序 只 要 给 地 址 为 /dev/log 的 socket 发 送 数 据 报 就 行 了 。 
hi /dev/ printer 被 一 些 打 印 系 统 使 用 。 


13.9.2 使 用 Unix 域 socket 编程 


为 了 学 习 Unix Bit socket 的 客户 /服务 器 编程 ,这 里 编写 了 一 个 日 志 系统 。 文 件 wimp 
就 是 日 志 系 统 的 -个 实例 。 文 件 wtmp 记录 系统 的 所 有 登录 ,退出 以 及 连接 。 日 志 系 统 被 保 
证 安全 和 系统 维护 的 程序 所 使 用 ,用 来 记录 一 : 些 可 疑 行为 。 日 志 服 务 器 是 一 个 抄写 员 ; 客户 
发 送信 息 给 服务 器 ,服务 器 将 这 些 信 息 保 存 到 只 有 自己 可 以 修改 的 文件 中 。 日 志 服 务 器 可 
以 用 任何 格式 保存 该 文件 ,客户 并 不 知道 这 些 细节 。 

这 里 的 日 志 服 务 器 使 用 Unix 域 socket 地 址 。 只 有 同一 台 主 机 上 的 客户 才能 发 消息 给 
它 。 下 面 是 客户 利 服务 器 的 代码 。 服 务 器 先 创建 socket, 然后 绑 定 地 址 ， 


fX ROO MON EK X X RM KHER X KO X OHOXOX MOX B X E RMR ER XO X X X X X X X XO X X X X X X KEKE RHE RE 
* logfiled.c - a simple logfile server using Unix Domain Datagram Sockets 

+ usage; logfiled 7-7» logfilename 

x/ 


4 include  «stdio.h— 

# include <(sys/types. ho> 
# include <(sys/socket. h> 
# include «< sys/un. h> 


# include «time. h> 


"4 define MSGLEN 512 
# define oops(m,x} | perror(m); exit(x); } 
H define SOCKNAME "/tmp/ logfilesock" 


int main(int ac, char * av[]) 


( 
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int sock; /* read messages here «/ 
struct Sockaddr un addr; : /* this is its address x/ 
socklen t addrlen; 

char msg| MSGLEN ! ; 

int 1; 

char sockname|  - SOCKNAME ; 

time t now; 

int msqnum = 0; 

char + timestr; 


/* build an address x/ 
addr. sun family = AF UNIX; j» note AF UNIX «/ 
strcpy(addr. sun path, sockname); /* filename is address */ 


addrlen = strlen(socknane? + sizeof(addr.sup family); 
sock = socket(PF UNIX, SOCK DGRAM, 0); /* note PF UNIX «/ 
if ( sock == -1) 
oops( "socket", 2) ; 
/* bind the address x«/ 
if ( bind(sock, (struct sockaddr x ) &addr, addrlen) == -1) 
oopst "hind", 3); 


/x read and write */ 


while(1} 

{ 
l = read(sock, msg, MSGLEN) ; /* read works for DGRAM «/ 
msg(1] = 'W0"; l /x make it à string */ 


time(&now) ; 
timestr = ctime( Snow) - 


timestr|strlen(timestr)- 1] = '\0’; 


r 


/* chop newline */ 


printf("| &5d] $s %s\n", msgnum * * , timestr, msg); 
fflush(stdout); 


这 里 仍 使 用 socket 和 bind 来 创建 服务 器 socket, socket 的 类 型 是 SOCK_DGRAM, ,地 
址 族 是 PF_UNIX®, socket 地 址 是 文件 名 。 使 用 read 而 不 是 recvfrom; 因 为 不 需要 应 管 。 
下 面 是 客户 端 程序 ; 


下 近江 并 
* logfilec.c - logfile client - send messages to the logfile server 


x usage; logfilec "a message here" 





D PF LOCAT Wii it PF UNIX, 
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# include <stdio.h> 
tinclude -«sys/types.h- 
d include  «Lsys/socket. hi> 


$ include x sys/un.h-- 


Ë define SOCKET "/tnp/logfilesock^ 


# define oops(nm,x) | perror(m?; exit(x); | 


main(jnt ac, char + av[ D 
ft 
1 

int sack; 


struct sockaddr_un addr; 


Socklen t addrlen; 
char sockname[ ] = SOCKET ; 
char *msq = av[1]; 


if¢acl= 2) 
fprintf(stderr, "usage: logfiiec 'message'Xn"); 
exit(li: 

} 

sock = sochet(PF UNTX, SOCK DGRAM, 0); 

if í sock == -13 


oops( "socket" ,2); 


addr. sun family = AF UNIX; 
strcpy(addr.sun path, sockname) ; 


addrlen = strlen(sockname) + sizeof(addr.sun family? ; 


if ( sendto(sock,msg, strlen(msq), 0, &addr, addrlen) == 一 1 ) 


oops( "sendto",3) ; 


这 里 人 重用 socket 函数 来 创建 socket , Jf A f Rh sendto 发 送 消 息 。 服 务 器 接 妆 消息 ,然后 
打印 消息 。 消 息 前 面 基 消息 编号 和 了 时间 。 
下 面 是 测试 的 情形 : 


$ ce logfiled.c - o logfiled 

8 ./logfiled => visitorlog 

1500 

$ cc lagfilec.c ~ o logfile 

$ . flegfilee ‘Nice system. Swell software! ! 

$ ./logfilec "Testing this log thing. " 

5 ./logfilec "Can you read this?" 

$ cat vistorlog 

[ OJ] Mon Aug 20 18,25,34 2001 Nice system. Swell software! 
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[ 1] Mon Aug 20 18,25,44 2001 Testing this log thing. 
L 2] Mon Aug 20 18,25,48 2001 Can you read this? 


上 述 两 个 程序 展示 了 如 何 使 用 Unix 域 socket 以 及 日 志 服 务 器 的 基本 思想 。 程 序 的 为 
一 个 特征 是 实现 了 自动 追加 功能 ,但 没有 使 用 O_APPEND。 服 务 器 接收 消息 ,然后 把 消息 
追加 到 文件 末尾 。 即 使 有 多 个 客户 同时 发 送 消 息 , 底 层 的 socket 机 制 会 负责 消息 的 序列 化 。 


13.10 小结: socket 种 服务 器 


socket 对 于 进程 辣 的 数据 通信 是 强大 的 .万 能 的 士 具 。 这 里 学 习 了 两 种 socket 和 两 种 
socket 地 址 。 i 








B. 
© Socket PF INET — PF UNIX 
SOCK, STREAM 连接 的 , 跨 机 器 连接 的 ,本 地 
SOCK_DGRAM 数据 报 , 跨 机 器 煞 据 报 , 本 地 


在 前 面 的 几 章 中 ,已 经 学 习 了 使 用 这 4 PAA) 3 种 socket 的 项 目 。 当 考虑 Unix 的 
网络 编程 各 准备 发 计 自己 的 项 日 时 ,可 以 考虑 使 用 这 张 表格 中 的 技术 。 根 据 发 送 消息 的 类 
型 以 及 消息 发 送 的 距离 来 选择 最 佳 的 技术 。 


小 Bi 


1, 主要 内 容 
数据 报 是 从 一 个 socket 发 送 到 另 一 个 socket 的 短 消 息 。 数 据 报 socket 是 不 连接 的 ， 
每 个 消息 包含 有 目的 地 址 。 数 据 报 (UDP)socket 更 加 简单 .快速 ,给 系统 增加 的 负荷 
更 小 。 
许可 证 服务 器 是 用 来 对 被 许可 程序 实施 许可 证 验证 规则 的 。 许 可 证 服务 器 发 布 许 
可 ,以 短 消 息 的 形式 发 送 给 客户 。 
许可 证 服务 器 必须 记 住 哪 个 进程 使 用 了 哪 张 票据 ,必须 维持 一 个 内 部 的 数据 库 。 因 
此 ,许可 证 服务 器 不 同 于 本 书 的 Web 服务 器 。 
* 记录 系统 状态 的 服务 器 必须 说 计 成 可 以 处 理 服务 器 和 客户 端的 朋 泪 事件 。 
有 些许 可 证 服务 器 为 一 个 网 络 上 的 多 个 机 器 提供 服务 。 有 儿 种 设计 方法 ,各 有 优 
socket 可 以 有 丙种 类 型 的 地 址 : 网 络 或 本 地 。 本 地 的 socket 地 址 叫做 Unix 域 
socket 或 名 字 socket。 这 种 socket 使 用 文件 各 作为 地 址 ,只 能 在 一 有 机 器 上 交 亡 
数据 。 

2， 下 一 步 的 工作 i 

本 章 学 习 了 两 种 服务 器 处 理 多 个 请 求 的 方法 。 许 可 证 服务 器 接收 数据 报请 求 ,并 且 一 
次 一 条 地 返回 消息 。Web 服务 器 接收 数据 流 消 息 , 并 且 使 用 fork 同时 应 答 所 有 请 求 。 服 务 
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器 有 另外 的 选择 ; 一 个 单一 进程 可 以 使 用 线程 的 技术 同时 运行 几 个 函数 。 下 一 章 将 学 习 有 
关 线程 的 思想 和 技术 。 


3. 习题 


13.1 


13.3 


13.5 


1 


CD 


在 使 用 流 socket 的 例子 中 ,服务 器 给 客户 应 答 时 ,并 没有 使 用 客户 端的 地 址 。 服 
务 器 是 如 何 知道 给 哪个 地 址 的 客户 发 消息 的 ? 


进程 25915 是 如 何 战胜 进程 25914 ARGH? 考虑 每 个 客户 进程 的 创建 和 服 
务 器 端 请 求 到 达 的 操作 序列 。 在 多 任务 系统 中 ,进程 恢 次 运行 。 进 程 在 哪儿 可 
以 被 中 断 从 而 得 到 测试 的 结果 ? 


如 何 使 用 一 个 许可 证 服务 器 处 理 2 个 或 更 多 的 程序 的 请 求 ? 一 种 方法 是 修改 协 
议 使 得 每 个 请 求 包含 所 要 运行 的 程序 名 。 描 述 可 以 支持 多 程序 协议 的 数据 结构 
和 程序 逻辑 。 





当 服 务 器 正在 处 理 客户 请 求 时 ,如 果 函 数 ticket_reclaim MIA, RHA MRA 
表 存在 潜在 的 破坏 ? 考虑 函数 中 每 个 更 改 数组 和 计数 器 的 地 方 。 在 哪 一 点 上 孝 


组 的 状态 和 计数 器 的 值 不 一 致 ? 处 埋 图 数 是 如 何 修 改 数 组 和 计数 器 的 ” 这 些 入 


的 一 个 未 预测 的 改变 对 常规 处 理 函 数 有 何 影响 ? 


当 进 程 被 创建 时 ,进程 ID 被 分 配给 进程 。 考 虑 下 商 的 时 间 序 列 : 一 个 进程 ID 为 
777 的 客户 得 到 票据 后 崩 演 了 。 不 久 , 一 个 不 同 的 用 户 运 行程 序 创 建 了 一 个 新 的 
进程 ,进程 了 D 丛 好 也 是 777。 当 ticket_reclaim 程序 运行 时 , 它 发 现 了 进程 777. 
即使 现在 编号 为 777 的 进程 是 一 个 不 相关 的 程序 ,并 及 不 持 有 曲 据 ,分 配给 原来 
进程 777 的 票据 也 不 能 被 同 收 。 当 这 种 情形 出 现时 ,该 如 和 何 处 理 ? 如何 避 免 这 类 
事件 的 发 生 。 l 


— Fh BF UEFA AEA AK EIR dic HE GB b EC HEB. A ACE Mix 
种 备份 机 制 ,该 如 何 改变 服务 器 ? 假设 客户 会 故意 杀 死 服务 器 以 得 到 更 多 的 票 
d ,那么 这 里 的 文件 备份 机 制 在 此 种 情形 下 该 如 何 工 作 ? 


持 有 早期 版 本 票据 的 客户 在 等 待 了 较 长 的 时 间 后 来 验证 票据 ,可 能 发 现 已 经 没 
有 更 多 的 可 用 票据 了 。 为 这 种 情形 设计 -种 应 管 ,使 得 客户 不 允许 继续 运行 , 因 
为 这 将 破坏 最 大 同时 运行 进程 的 数目 ,但 要 求 客户 不 能 突然 退出 。 


参照 本 章 中 列 出 的 问题 ,比较 三 种 分 布 式 许可 证 服务 器 模型 。 


使 用 socket 时 ,可 以 用 write 和 sendto 来 发 送 数 据 。 阅读 send 和 sendmsg ff $6 
BFI ,后 面 两 个 函数 与 前 面 的 有 什么 区 别 ? 


10 轿车 管理 系统 与 数据 报 不 只 是 比喻 。 设 想 每 部 轿车 都 装 有 GPS 设备 。 一 个 计 


算 机 可 以 通过 modem 连接 到 .Internet ,使 得 可 以 定位 轿车 的 位 置 。 设 想 轿车 的 
启动 不 是 受 钼 是 控制 ,而 是 通过 一 个 磁卡 的 登录 来 控制 。 设 计 一 个 允许 雇员 登 


4, 


13. 


13. 


13. 


13. 


13. 


13. 


13. 


13. 


13. 
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录 到 系统 来 使 用 轿车 ,并 且 管 理 员 可 以 跟踪 司机 行驶 路 线 以 及 定位 轿车 位 置 的 


1l 


12 


13 


.14 


16 


17? 


18 


19 


. 20 


21 


更 改 程序 dgrecv. c, BR RACE ET H A E A AY b hk F0 TEE E. Be AC ARS EST [e] ,还 要 打印 
消息 编号 。 消 息 标号 从 0 开始。 希望 得 到 的 输出 如 下 : 

dgrecv;got a message ; testing 123 

from. 10.200,75,200;1041 

at ;Sun Aug 19 10:22.27 EDT 2001 

msg ;23 


A dgsend. c 增加 客户 程序 dgrecv2.c。 


许可 证 服务 器 在 一 张 表 中 人 不 有 客户 拥有 票据 的 信息 。 如 果 想 要 服务 器 打印 这 
些 信息 ,该 如 何 操作 ? 看 到 表 的 信息 有 助 于 排 错 或 测试 服务 器 。 一 种 标准 欧 和 
服务 器 通信 技术 是 使 用 信号 。 


更 改 程序 lserv] 使 得 它 在 接收 信号 SIGHUP 时 ,打印 出 表 的 内 容 。 可 以 通过 命 


4 kill — HUP serverpid 来 测试 该 特征 。 


更 改 许可 证 服务 器 使 得 它 只 在 一 个 客户 的 请 求 被 拒绝 时 , 才 调 用 ticket_reclaim 
程序 。 该 方法 的 优 缺 点 各 是 什么 ? 


更 改 lclnt2.¢ 程序 ,使 它 睡 眠 5 秒 钟 后 验证 贾 据 。 如 果 票 据 合 法 ,客户 再 睡眠 5 


. 秒 钟 ,然后 退出 并 归还 票据 。 如 果 票 据 不 合法 ,客户 党 试 请 求 男 - 个 票据 。 如 果 


成 功 ,继续 正常 操作 。 如 果 失 败 ,告诉 用 户 许 可 证 服务 器 出 错 然 后 再 退出 。 


更 改 前 面 章 节 中 编写 的 shell 穆 序 和 bounce 程序 ,使 用 许可 证 服务 器 。 在 哪 增 
加 票据 验证 过 程 y 当 服 务 器 崩溃 时 ,票据 不 可 用 了 ,该 和 用 户 说 什么 ? 


更 改 客 户 服务 器 代码 使 得 票据 包含 有 主机 IP 地 址 。 如 何 改 电 票据 列 表 ? 确信 
对 验证 函数 也 做 了 改变 。 


实现 三 种 分 布 式 许 可 证 控制 模型 的 一 种 。 


日 志 系 统 的 -个 间 题 是 其 中 的 请 息 都 是 匿名 的 ,更 改 该 系统 使 得 消息 包 含 发 送 
消息 用 户 的 用 户 名 。 


在 日 志 服 务 器 中 使 用 read。 编 写 两 个 新 版 本 的 服务 器 ,一 个 使 用 recvfrom, 另 
一 个 使 用 recev。 这 些 获取 数据 的 方法 有 何不 同 ? BREA 
TH. 


如 果 许 可 证 服务 器 和 客户 需要 使 用 Unix E socket, FEMME? 解释 客户 为 
什么 要 使 用 bind, 
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13.22 在 第 1 章 中 ,讨论 了 一 个 Internet 桥牌 游戏 。 在 任何 的 分 布 式 扑克 游戏 中 ,软件 
必须 模拟 一 个 扑克 牌 栈 , 以 确保 两 个 客户 不 会 持 有 相同 的 扑克 。 
编号 -- 对 程序 cardd 和 carde, fH FA CH AR HE Ub EB — so Th ye. i SIR HH 
洗 牌 , 接 下 来 客户 从 命令 行 启动 ,就 可 以 队 服 务 器 获取 扑克 牌 。 倒 程 运行 如 下 : 
$ cardo get 5 
AD AH 2D TD KC : . 
结果 显示 客户 得 到 了 5 张 牌 ,-- 张 方块 4. — EET PE A .--3E AR 2, —3K AR 10, 
一 张 二 。 确 保 程序 不 会 将 相同 的 扑克 牌 发 给 两 个 用 户 机 ,并 且 协 议 要 有 途径 表 
BR dealer 何 时 发 完 牌 。 考 虑 一 下 还 有 其 他 什么 有 用 的 事务 可 以 作为 协议 的 
补充 ? 


5. 项目 
基于 木 章 的 内容 ,可 以 学 习 编 写 下 面 的 Unix 程序 ， 
talk. rwho, ii tk RS FE 
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概念 与 技巧 

* 程序 的 执行 路 线 

| 多 线程 程序 

”创建 及 销毁 线程 

”使 用 互 斥 锁 术 制 保证 线程 问 数 据 的 安全 共享 
， 使 用 条 件 变 量 同步 线程 间 的 数据 传输 

。 传递 多 个 参数 给 线程 

相关 的 系统 调用 与 函数 

* pthread create, pthread join 

+ pthread mutex lock, pthread mutex unlock 


* pthread cond wait,pthread cond signal 


14.1 同一 时 刻 完成 多 项 任务 


不 知道 你 是 否 经 常会 被 一 些 充 满 了 闪烁 .跳动 或 者 旋转 图 片 的 网 页 弄 得 很 不 舒服 ,不 过 
我 确实 不 喜欢 它们 。 然 而 尽管 这 些 网 页 让 人 很 烦 , 它 们 却 引 发 了 一 个 技术 问题 : 一 个 程序 如 
何 才 能 在 同一 时 刻 完 成 多 个 任务 呢 ? 

动 通 图 片 并 不 是 惟一 可 以 完成 并 发 功能 的 Web £T. HAE B pe asc 
可 以 从 不 同 的 服务 器 上 下 载 并 且 解 压缩 图 片 。 浏 览 器 并 行 地 完成 这 么 多 的 任务 ,而 非 一 项 
接 一 项 地 做 ,那么 它 又 是 如 何 同 时 下 载 并 解压 这 些 图 片 的 ? 

多 任务 系统 的 问题 在 本 书 中 早已 介绍 过 了 。 视 频 游 戏 那 一 章 , 使 用 计时 器 和 两 个 计数 
器 在 两 维 空间 中 控制 图 片 的 动作 。 其 他 的 章节 也 曾 用 fork 和 exec 创建 新 进程 的 方法 处 理 
并 发 程序 ,从 而 实现 一 个 Web 服务 器 的 功能 。 那么 这 里 为 何不 用 这 种 方法 驼 ? 

书 中 曾 使 用 fork 和 exec 同时 运行 多 个 程 府 。 如 果 希 望 同 时 运行 几 个 函数 ,或 者 同时 对 
一 个 函数 调用 很 多 次 , 那 该 怎么 办 呢 ? 

本 章 将 介绍 线程 。 线 程 相对 于 函数 就 类 似 生 进程 相对 于 程序 ,后 者 为 前 者 提供 了 运行 
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环境 。 很 多 函数 可 以 同时 运行 ,但 它们 都 在 相同 的 进程 中 。 
本 章 主 要 的 项 目 是 完成 一 个 程序 让 文本 框 中 出 现 不 断 移动 的 文字 。 这 里 将 先 修改 以 前 
的 那个 Web 服务 器 程序 ,让 它 不 启动 新 的 进程 即 可 处 理 访问 目 永 列表 以 攻 文 件 内 容 的 并 发 


14.2 函数 的 执行 路 线 


什么 是 线程 ? 有 何 扫 ?又 如 何 去 创 建 它 呢 ?首先 看 下 面 的 一 个 传统 的 程序 ,在 此 程序 
中 ,指令 一 条 接 一 条 的 顺序 执行 。 然 后 ,只 要 将 此 程序 做 两 个 小 的 改动 , 妈 可 让 程序 并 行 的 
TA WI RAE 


14.2.1. 一 个 单线 程 程序 


/* hello_single.c - a single threaded hello world program */ 





H include <istdio, ho 
H define NUM 5 


main() 
í 


void print_msg(char * ); 


print_msq(("hello"); 
priat_msg{("world\n") ; 
} 
void print msg(char * m) 
{ 
inl i; 
for (i=0 ; i-NUM ; itt 
printf((" & s", m); 
fflush(stdout); 
sleep(1); 


t 


在 hello single. c H, main a BFF bW TATER. REP AIT PE. 
Fn Big tH SR ie RT A A ED; 


$ cc hello single.c ~ o hello single 
5 ./hello single 
hellohellohellohellohelloworid 
world i 

world 

world 

world 


3 
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上 面 的 每 一 行 输 出 之 间 都 有 一 个 1 秒 钟 的 时 延 , 程 序 共 运行 了 10 Eo. E 14. 1 展示 了 此 
程序 的 执行 流程 。 


执行 路 径 














图 14.1 单 执行 路 径 


首先 ,执行 路 径 进 人 main BRM A Jer EA BR print_msg。 接 着 ,从 print msg 中 返回 到 
main, 之 后 再 一 次 进 人 print_msg 函数 进行 第 二 次 的 获 数 调用 。 所 有 指令 执行 完毕 后 ,从 
main 中 返回 。 

不 问 断 地 跟踪 指令 执行 的 路 径 在 这 里 被 浆 做 执行 路 线 (thread of execution) 。 传 统 的 程 
序 只 有 一 条 单独 的 执行 路 线 。 就 算是 包含 有 goto 请 句 以 及 递归 子 程序 的 程序 也 只 有 一 条 执 
行路 线 ,尽管 这 条 路 线 有 时 有 些 弯 弯 绕 绕 


14.2.2 一 个 多 线程 程序 


如 果 想 同时 执行 两 个 对 于 print, msg 函数 的 调用 ,就 像 便 用 fork 建立 两 个 新 的 进程 一 
样 , 那 该 怎么 办 呢 ? 这 种 思想 清楚 地 体现 在 图 14.2 p, 


原始 线程 








print magi) 


amm 











新 的 线程 
图 14.2 ”多 执行 路 径 的 程序 


首先 ,一 条 执行 线路 进入 main BH. 初始 的 线路 新 建 了 一 条 新 的 执行 线路 来 运行 函数 
print_msg。 初 始 线路 继续 执行 下 一 条 指令 从 而 新 建 了 另 一 条 线路 来 对 print msg 函数 进行 
第 二 次 的 调用 。 最 后 ,初始 线路 等 待 两 条 新 的 线路 加 入 自己 ,再 从 main PIE A, 

人 们 无 时 无 刻 不 在 进行 着 这 种 多 线程 的 任务 管理 。 如 果 父 母 需要 做 许多 瑞 事 ,他们 通 
常会 带 上 和 孩子 一 起 去 。 父 母 让 一 个 孩子 到 杂货 铺 买 牛奶 , 另 一 个 孩子 去 图 书馆 还 书 。 最 后 
等 两 个 该 子 都 回来 之 后 ,大 家 再 一 起 回 家 。 

一 个 线程 就 类 似 于 上 例 中 和 帮 父 母 做 事情 的 一 个 孩子 。 如 果 想 同时 完成 许多 事情 ,最 好 
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SHAE odd. KU WR TBE RMA PRS ER. 它 必 须 创建 多 个 线 
程 。 下 面 的 这 个 程序 hello_multi. e 将 图 14. 2 的 思想 实现 了 。 


/* hello multi.c - a multi - threaded hello world program xf 


# include «stdio. hi> 
# include «pthread. h> 
# define NUM 5 

maint} 

了 


à 


pthread t tl, t2; /* two threads «/ 
void * print msg(void x»); 


pthread create(&t1, NULL, print msg, (void x* )"hello'"); 
pthread create(&t2, NULL, print msg, (void x )"world\n"); 
pthread join(tl, NULL); 

pthread join(t2, NULL); 


void * print msg(void * m) 
Í 
char *cp = (char x ) m; 
int i; 
for (i=0 ; i- NUM ; itt} 
printf(" $s", m); 
fflushístdout); 
sleep(1); 
H 
return NULL; 
} 


注意 一 下 此 程序 与 原先 那个 程序 的 区 别 。 首 先 ,这 里 包含 了 一 个 头 文件 pthread. h, E 
包含 了 数据 类 型 的 定义 和 痛 数 的 原型 。 其 次 ,程序 中 定义 了 pthread t 类 再 的 两 个 变量 tl 和 
t 记 。 这 两 个 线程 就 类 似 于 上 面 所 说 的 父母 办 事 时 所 带 的 两 个 孩子 。 

图 14.2 控制 流 中 的 每 一 个 分 支点 都 对 应 了 如 下 的 一 行 代码 : 


pthread create(&ti , NULL, print_msq,(void* )"hello") 


JH, 8E AÉCUR FH BR 2K (OL A2 SEG NB FAB hello 来 运行 函数 print_msg。” 上 看 第 
一 个 参数 是 线程 的 地 址 ; 第 二 个 参数 是 指向 线程 属性 的 指针 ; 第 三 个 参数 是 所 要 执行 的 函 
数 名 称 ; 而 第 四 个 参数 则 是 指向 所 要 传递 给 函数 的 参数 的 指针 。 

这 条 指令 使 用 指定 的 属性 新 建 了 一 个 线程 ,而 此 线程 使 用 参数 hello 来 运行 函数 


print_msg. 
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pthread_create(&t2, NULL, print msg, (void x )"world\n") 


此 函数 也 使 用 默认 的 属性 创建 了 -- 个 新 的 线程 。 新 的 线程 用 参数 world\n oie fr BR 
print msg, l 

ifj KA pthread_join(t],NULL); XMF LE SE SEAT IEDSE EE , main 借助 于 此 函数 来 
“Se PTR RTT RAR IR, PEE pthread join 使 用 了 两 个 参数 。 第 一 个 参数 是 所 要 等 
待 的 线程 ,而 第 二 个 参数 则 是 一 个 指向 返回 值 的 指针 。 如 杂 此 参数 为 NULL, #75 iR BAA 
S XE. 

pthread join(12, NULL); 表示 main 前 数 等 待 男 一 个 线程 返回 。 

编译 此 程序 ,并 运行 ,输出 结果 如 下 ， 

$ cc hello multi.c - lpthread - o hello multi 

$ ./hello multi 

helloworld 

hel loworld 

helleworld 

helloworld 

helloworld 

$ 

此 程序 只 运行 了 5 秘 钟 , 因 为 两 个 循环 并 行 的 执行 。 不 过 对 于 线程 调度 的 不 同 可 能 会 导 
臻 输出 与 上 面 所 示 的 输出 不 同 。 大 家 可 能 已 经 注意 到 ,线程 的 使 用 是 多 么 的 灵活 。 在 这 里 
同时 运行 了 同一 个 函 效 的 两 个 不 同 实例 ,仅仅 参数 是 不 同 的 。 当然 同时 运行 两 个 不 同 的 函 
数 也 是 -- 样 的 容易 。 


14.2.3 IJHxXH UNE 


pthread create 














目标 创建 一 个 新 的 线程 

x4 & include « pthread. h> 

aA m m int pthread, create Cpthread 1 * thread, 
pihread air 1 £ attr, 
void x ( x func) (void » ) 
void * arg) i 

ex : thread 指向 puhread i25 Xam Eb S 3E at 


attr > 指向 pthread_attr_t Æ MR S E ,或 者 为 NULI. 
func 指向 新 线程 所 运行 函数 的 指针 
arg 传递 给 func 的 参数 








返回 值 成 功 返 回 
errcode ##i8 
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pthread create 函数 创建 了 一 条 新 的 执行 线路 ,在 此 新 的 线程 内 调用 了 func(arg)。 新 线 
程 的 属性 由 attr 参数 来 指定 。func 是 一 个 函数 , 它 接收 一 个 指针 作为 它 的 参数 ,并 生 运 行 结 
束 后 返回 一 个 指针 。 参 数 和 返回 值 都 被 定义 为 类 型 为 voidx 的 指针 :以 允许 它们 指 同 任何 类 
型 的 值 。 

如 果 attr È A NULL ,线程 使 用 的 是 默认 的 属性 。 下 一 - 章 中 将 讨论 线程 的 属性 . 
pthread create 如 果 运 行 成 功 返 回 0, 和 否则 返回 一 个 非 零 错误 代码 。 


Pthread join 





























目标 等 待 某 线程 终 目 u 
3 x9 # incl ude « ~pthread. h> 
aes ew int phead inne pated: 1 thread, void * * retval) 
参数 thread 所 等 待 的 线程 
retval 指向 某 存 储 线程 返回 值 的 变量 
Bee 0 成 功 返 加 
errcode 错误 


pthread join 使 得 调用 线程 挂 起 直至 由 thread 参数 指定 的 线程 终止 。 如 果 retvai 不 是 
null, 线程 的 返回 值 就 将 存储 在 由 retval TÉ AS SE BEB 。 

当 线 程 终止 时 ,ptihread_join 函数 返回 0, 如 果 有 错误 发 生 , 则 返回 一 个 非 零 错 误 代码。 
如 果 某 线程 试图 等 待 一 个 并 不 存在 的 线程 .多 个 线程 同时 等 待 一 = Ree ES pU 
等 待 自 己 都 将 导致 函数 返回 一 个 错误 代码 。 

使 用 线程 进行 编程 就 像 给 一 些 人 赋予 不 同 的 任务 。 如 果 加 强项 自 管理 ,保证 所 有 的 人 
都 能 够 按 序 办 事 ,不 和 别人 冲突 ,这 个 项 目 肯 定 会 提前 完成 。 下 面 将 介绍 可 以 使 线程 分 工 合 
作 的 技术 。 





14.3 ”线程 间 的 分 工 合作 


进程 闻 可 以 通过 管道 .socket. 信 和 号 .退出 /等 符 以 及 运行 环境 来 进行 会 话 。 线 程 间 的 通 
信也 很 容易 。 多 个 线程 在 一 个 单独 的 进程 中 运行 ,共享 全 局 变量 ,因此 线程 间 可 以 通过 设置 
和 读 中 这 些 全 局 变量 来 进行 通信 。 不 过 要 知道 ,对 共享 内 存 的 访问 可 是 线程 的 一 个 有 既 有 用 
又 极为 危险 的 特性 。 


14.3.1 i 1: inerprint,e 





/* incprint.c - one thread increments, the other prints «/ 


# include < stdio. h> 
f include < pthread. h> 


# define NUM 5 
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int counter = 0; 


main() 

1 
pthread_t t1; /* one thread «/ 
void * print counk(void * );  /* its Function +/ 
int i; 


pthread create(&tl, NULL, print count, NULL); 
for( i = 0 ; i«NUM ; i++ ){ 

counter ++ ; 

sleep(l); 
} 


pthread, join(tl, NULL); 
) 
void + print count(void » m) 
( 
int 3; 
for (i=0 ; i«NUM ; itt M 
grintf("count = % d\n", counter): 
sleep(1); 
》 
return NULL; 
} 


程序 incprint 习 使 用 了 两 个 线程 。 初 始 线程 执行 了 一 个 循环 来 使 计数 器 值 每 秒 钟 增 1， 
初始 线程 在 进入 循环 之 前 ,创建 了 一 个 新 的 线程 ; 新 的 线程 运行 了 一 个 函数 来 将 counter 的 
值 打 印 出 来 。main 函数 和 print. count 函数 运行 在 同一 个 进程 中 ,所 以 都 有 对 于 counter 的 
访问 权 。 图 14.3 展示 了 两 个 函数 和 全 局 变量 的 内 在 逻辑 。 


See 


pr int count ü 





图 14.3 两 个 线程 共 襄 全 局 变量 


当 main RAAT counter 值 之 后 ,print_counter 晴 数 立即 可 以 访问 到 新 的 值 。 因 此 
并 不 需要 通过 管道 或 者 套 接 字 等 方法 传送 新 的 值 。 编 译 这 个 程序 ,然后 运行 它 ,结果 如 下 


5 cc incprint,c - lpthread - o incprint 
$ ./inoprint 
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count = I 
count = 2 
count = 3 
count = 4 
count = 5 


程序 显然 可 以 正常 工作 . —- EXC o TER. A-TORERH GITEN MB, 
这 个 例子 展示 了 如 何 使 运 行 在 不 同 线程 中 的 函数 共享 全 局 变量 。 不 过 下 个 例 予 还 要 有 趣 。 


14.3.2 例 2: twordcount. c 


很 多 学 生 都 有 这 样 的 经 验 , 对 着 电脑 数 自己 学 期 沦 文 的 字数 以 确定 字数 是 不 是 足够 。 
假设 一 个 学 生 有 一 篇 10 页 纸 的 论文 , 它 有 两 种 方法 来 计算 这 篇 文章 的 字数 。 一 种 是 一 个 字 
一 个 字 地 数 了 10 页 纸 , 另 一 种 方法 是 找 10 个 同学 来 ,给 入 个 同学 一 页 纸 , 让 他 们 分 别 计算 . 
然后 将 结果 累加 起 来 。 显 然 并 行 地 计算 这 L0 页 纸 的 字数 的 方法 会 快 很 多 - 

Unix 平台 上 的 wc 程 序 的 作用 是 计算 一 个 或 多 个 文件 中 的 行 .单词 以 及 字符 个 数 。 不 
过 wc 是 一 个 典 错 的 单线 程 程序 。 怎 样 立 设计 一 个 多 线程 程序 来 计数 并 打印 两 个 文件 中 的 
所 有 字数 呢 ? 

“版 本 1: 两 个 线程 .一 个 计数 器 

第 一 个 版 本 程序 创建 分 开 的 线程 来 对 每 一 个 文件 进行 计算 。 所 有 的 线程 在 检查 到 单间 
的 时 候 对 同一 个 计数 器 增值 A 14. 4 体现 了 这 个 思路 。 





一 个 进 释 
一 个 计数 器 
两 个 线程 





图 14.4 两 个 线程 共享 一 个 通用 计数 器 
此 版 本 的 代码 包含 在 文件 twordcountl.c 中 : 


/* twordcountl.c - threaded word counter for two files. Version 1 x/ 


# include <stdio.h> 
d include < pthread. h> 
# include <ctype. h> 


int total words ; 


main(int ac, char *av[]) 
{ 
pthread t ti, t2; /x two threads x/ 
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void | * count words(void *); 


if (C ac 1= 3){ 
printf( "usage: % s filel file2\n", av| 0; 
exit(1); 
} . 
total words = 0; 
pthread create(&tl, NULL, count words, (void +) av[1]); 
pthread create(&t2, NULL, count words, (void x) avi 2 P; 
pthread join(t1, NULL); 
pthread join(t2, NULL); 
printf(" $ 5d, total words\n", total words); 
} 
void x count words(void * f) 
{ 
char x filename = (char x) f; 
FILE * fp; 


int c, preve = 'AO'; 


if ( (fp = fopen(filename, "r")) |= NULL): 
while( ( c = getc(fp))!- EOF ){ 
if(! isalnum(c) && isalnum(prevc) ) 
total words ++ ; 1 


preve = c; 
t 
fclose(fp); 
) else 
perror( filename) ; 
return NULL; 


} 
函数 count words 是 这 样 区 分 单词 的 : 几 是 一 个 非 字 母 或 数字 的 字符 跟 在 字母 或 数字 


的 后 面 ,那么 这 个 字母 或 数字 就 是 单词 的 结尾 。 当 然 这 种 思路 忽略 了 文件 的 最 后 一 个 单词 ， 
并 且 还 把 “U. S. A. "看 成 三 个 独立 的 单词 。 编 译 此 程序 并 按照 如 下 的 方法 进行 测试 





ô cc twordcountl.c - lpthread - o twel 
S ./twcl /etc/group /user/dict/words 
45614, total words 
swe -w fete/gronp /usr/dict/words 
58 /etc/group 
45402 /user/dict/words 
45460 total 


twordcountl 产生 的 结果 与 we PAA. A Et Re SCA Al 
ERG — 7 be SA A HORE Dn Bd 9 LB. 所 有 线程 对 同一 个 计数 器 进行 操作 ,并 且 在 
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同时 进行 细心 的 读者 也 许 会 同 , 这 样 会 不 会 有 问题 啊 ? C 语言 并 没有 指定 操作 total_ 


total words = total words + 1 


也 就 是 说 ,程序 先 将 计数 器 当前 的 值 存 人 寄存 器 中 1 操作 后 ,再 将 其 恢复 到 内 存 中 。 

邦 么 如 果 所 有 线程 在 同一 时 刻 都 使 用 * 取 出 - 如 一 存储 ?的 序列 来 完成 对 计数 器 的 操 
fF ,结果 会 如 何 呢 ? 

图 14.5 所 示 的 是 所 有 线程 取出 同样 的 值 ,对 寄存 器 增 1, 然 后 再 恢复 新 的 值 。 两 次 增 1 
操作 同时 发 生 , 但 是 计数 器 的 值 只 能 一 次 一 次 的 增加 。 如 何 来 保证 线程 介 不 会 互相 干扰 对 
方 工作 呢 ? 下 面 将 采用 两 种 办 法 进行 尝试。 

bs Thread 1 Thread 2 


toral words get value trom variable 


ETT 


. 
E get value trom variable 








| LCC 1 - 
i [一 add . ce value 
es [o] 
: 1st 
: 121 
` lti sbore ic variable 
a store in varisb.e [ES 


图 14.5. 两 个 线程 对 同 … 个 计数 器 进行 操作 


， 版 本 2: 两 个 线程 ,一 个 计数 器 一 个 互 斥 量 

大 家 注意 到 在 机 场 或 者 公交 车 终点 站 的 公共 存 情 柜 始终 是 打开 的 ,除非 有 人 在 里 面 
存 了 东西 。 当 -… 个 人 扔 了 僻 币 然后 拿 到 了 销 匙 之 后 , 便 没 有 别人 可 以 再 去 打开 那个 柜子 
了 。 只 有 等 到 这 个 人 归还 了 钥匙 ,把 柜子 打开 之 后 ,其 他 人 人 才 可 以 再 去 使 用 。 类 似 地 ,如 
果 两 个 线程 需要 安全 地 共享 一 个 公共 的 计数 器 ,它们 也 需要 这 样 一 种 方法 把 变 最 加 锁 。 

线程 系统 包 食 了 称 为 互 斥 锁 的 变量 , 它 可 以 使 线程 间 很 好 的 合作 ,避免 对 于 变量 ,函数 
以 及 资源 的 访问 冲突 。 下 面 的 程序 twordcount2. c 将 告诉 大 家 如 何 创 建 和 使 用 互 斥 量 : 


/* twordcount2.c - threaded word counter for two files. «/ 
ft version 2: uses mutex to lock counter */ 

d include <(stdio. h> 

# include <7 pthread, h> 

B include «ctype. h> 


int total words ; /* the counter and its lock x/ 


pthread mutex t counter lock = PTHREAD MUTEX INITTALIZER; 


main(int ac, char * awl!) 
1 
pthread t tl, t2; /* two threads */ 


void * count words(void * ); 


if ( ac!- 3)| 
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printf("usage; %s file! file?\n", avg [0]; 


exit(1); 


} 
total words =(0]; 


pthread create(St1, NULL, count words, (void *) av[1]; 
pthread create(&t2, NULL, count words, (void « ) av[2]); 


pthread oin(€1, NULL); 
pthread_join(t2, NULL); 


printf(" & 5d. total wordsXn", total words); 


} 

void * count words(void + f) 

{ 
char » Filename = (char +) f; 
FILE » fp; 


int c, prevc = "XO'; 


if ( (£p = fopen(filename, "r"))!- NULL | 


while( ( c = getc(fp))|- EOF ) 


{ 


if ( | isalnum(c) && isalnum(prevc) ){ 
pthread mutex lock(&counter lock); 


total words ++ ; 


pthread mutex unlock(&counter lock); 


} 
prevc = c; 
} 
fclose(fp); 
) else 
perror( Filename) ; 
return NULL; 
! 


此 程序 的 逻辑 类 似 于 图 14. 6 ER. 


一 个 进程 
一 个 计数 器 







一 个 锁 
zs eRe 





图 14,6 了 两 个 线程 使 用 互 斥 锁 来 
共享 计数 器 


细心 的 读者 可 以 发 现 ,在 原来 的 程序 中 仅仅 加 
TERRE. 首先 定义 了 一 个 pthread_mutex_t 类 
型 的 全 局 变量 counter. lock, 然后 赋 给 它 一 个 初 值 。 
另外 改 劲 的 邮 方 就 是 把 对 于 count_words 8938 E 3 
在 对 两 个 函数 pthread_mutex_lock 以 及 pthread_ 
mutex unlock 的 油 用 之 间 。 

现在 丙 个 线程 可 以 安全 邮 共 享 计 数 器 了 。 当 一 
个 线程 调用 prhread_mutex_lock 的 时 候 , 如 果 另 一 
个 线程 已 经 将 这 个 互 斥 量 锁 住 了 , 那 这 个 线程 只 好 阻 
塞 等 待 着 这 个 锁 被 另 一 个 线程 解 开 后 , 才 可 以 对 计数 
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器 讲 行 操作 。 每 个 线程 对 计数 器 进行 操作 后 ,都 将 丘 斥 量 解锁 ,然后 循环 地 处 理 其 他 数据 。 
任何 数目 的 线程 都 可 以 挂 起 等 待 互 斥 量 解 锁 。 当 一 个 线程 对 互 厂 量 解锁 之 后 ,系统 就 

将 控制 权 交 给 等 候 的 时 一 线程 。 如 所 有线 程 都 按照 这 种 互 斥 原 则 进行 通信 时 , 互 太 量 是 有 

用 的 ; 然而 如 果 一 个 线程 不 遵守 这 个 规划 ,直接 去 修改 计数 器 的 值 的 话 ,程序 员 也 无 能 为 力 。 





pthread_mutex_lock 


























目标 #2 RRA mR 
六 文件 Hindude < pthread, hz» 
ASRS ae ck E E EE 
oe nex 指向 互 斥 锁 对 象 的 指引 a 
O EM BEEN AE mem BEEN 





errcode Hk 





pthread mutex lock 函数 用 来 锁 住 指定 的 万 斥 量 。 如 果 互 斥 量 尾 开放 的 , 它 被 锁 仕 ,并 
只 能 由 调用 线程 来 管理 。 如 果 此 时 芷 斥 量 已 经 裕 另 外 的 线程 锁 住 ,调用 线程 将 挂 起 等 待 此 
瑟 斥 量 被 解锁 。 如 果 兰 用 过 程 中 出 现 错 误 ,函数 将 返 问 一 个 错误 代码 ， 








pthread_mutex_unlock 





























目标 ATFERD 

pem 4 include e pthread, h> ' 
函数 原型 int pthread_mutex_uniock(pthread_mutex_t* mutex) 

参数 Omt ”指向 互 尽 锁 对 象 的 指 革 。 

返回 值 i o 成 功 返 回 | 


errcode 错误 





pthread mutex unlock 函数 给 指定 的 互 不 量 和 解锁。 如果 有 线程 佳 起 等 待 此 互 上 斥 量 ,其 
中 的 . -个 线程 将 获得 对 互 斥 锁 的 控制 权 。 芳 解锁 成 功 ,此 丽 数 将 返回 0, 和 否则 返回 一 个 非 堆 
的 错误 代 玛 . 

AH LEC HRA IER HR. MR-P+RERE PRM —-THRAR EDU 
那 会 怎么 样 ” MRRACARM-+EAMENW ER BI? 又 如 果 一 个 线程 还 没有 对 自 
C54 ERU 1 BM ORB TBARS nap Eo 不 同 的 线程 系统 对 于 这 些 问题 的 处 
理 方 法 各 不 相同 。 详 情 请 参见 你 所 使 用 的 Unix 的 参考 手册 。 

JÉT mE HAE? 如 果 多 个 线程 企图 在 同一 时 刻 修 改 相同 的 变量 ,它们 只 好 使 用 互 斥 量 
来 避 人 饮 访 问 冲突 。 然 而 使 用 互 斥 量 使 得 程序 运行 速度 变 慢 。 对 所 有 文件 中 的 每 一 个 单词 者 
需要 执行 检查 ,设置 以 及 释放 锁 的 操作 ,这 使 得 程序 效率 低下 。 更 加 有 效 的 方法 是 为 每 个 线 
程 设 置 自 己 的 计数 器 。 

* BE 3: 两 个 线程 .两 个 计数 器 .向 线程 传递 名 个 参数 

下 一 个 版 本 的 字数 统计 程序 为 每 个 线程 设置 了 自己 的 计数 器 ,从 而 避免 了 对 于 互 斥 量 
的 使 用 。 当 线程 返回 之 后 ,再 将 这 两 个 计数 器 的 值 加 起 来 得 到 最 后 的 结果 ， 
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如 何 来 得 到 这 些 线程 的 计数 器 ?” 义 如 何 使 线程 将 它们 的 计数 值 返回 呢 ?” 在 一 个 通常 的 
单线 程 程序 中 ,字数 统计 函数 将 得 出 的 字数 返回 给 它 的 汕 用 陆 数 ,线程 可 以 通过 调用 
pthread_exit 得 到 返回 值 , 这 个 返回 值 又 可 以 通过 pthread_join 的 调用 被 原先 的 线程 得 到 。 
详情 可 以 参见 手册 。 下 面 将 使 用 一 个 稍微 简单 一 点 的 方法 。 

调用 线程 通过 传递 给 函数 一 个 指向 某 变 量 的 指针 ,让 苑 数 对 此 变量 进行 操作 ,从 而 可 以 
避免 让 线 种 将 值 传 回 。 传 递 指针 引发 了 -个 问题 : 函数 pthread_create 只 能 允许 传递 -个 
参数 给 吨 数 , 而 文件 名 又 必须 传 给 遇 数 , 孝 么 如 何 传 这 个 指针 呢 ? 办 法 很 简单 ,只 需 建 -- 个 
包含 两 个 成 员 的 结构 体 , 然 后 将 此 结构 体 的 地 址 传 给 函数 即 吕 。 


/* twordcount3.c - threaded word counter for two files. 





* - Version 3, one counter per file 


xf 


# include «stdio. h> 
H include < pthread. h 
# include <I ctype. hi> 


struct arg_set | /* two values in one arg «/ 
char * fname; /* file to examine af 
int count; /* number of words »/ 


te 
main(int ac, char * av] D 


{ 


pthread t ti, t2; /* two threads #/ 
struct arg set argsl, args2; /* two argsets x/ 
void * count words(void x); 


it ¢ aclh= 3)! 
printf( "usage, %s filel file2\n", av #k[0]; 
exit(1); 

} 

argsl.fname = av[1]; 

argsl.count = 0; 


z 


pthread create(&tl, NULL, count words, (void * ) Sargs1); 


args2.fname - av[2]; 
args2.count = 0; 


r 


pthread create(&t2, NULL, count words, (void *) &arqs2); 


pthread join(tl, NULL); 

pthread join(t2, NULL); 

printf("% 5d, % s\n", argsl.count, av[1]; 

printf("% 5d, & sin", args2. count, av[2]); 

printf(" $ 5d; total words\n", argsl.count + args2. count); 
} 


void * count words(void » a) 
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struct arg_set x args = à; /* cast arg back to correct type «/ 
FILE » fp; 
int c, prevc = 'XO'; 


if ( (£p = fopen(args- > fname, "r"“))!= NULL ){ 
while( ( c = getc(fp)) |» EOF ){ 
if ( | isaloum(c) && iasalnum(preve) ) 
args - > count ++ 
presc = c; 
} 
fclose(fp); 
} else 
perror(args - > fname}; 
return NULL; 
} 


这 里 通过 定义 一 个 以 文件 名 和 该 文件 中 字数 为 成 员 的 结构 体 解决 了 同时 传递 两 个 参数 
的 问题 。main 函数 定义 了 两 个 这 种 类 型 的 局 部 变量 ,并 将 这 两 个 变量 的 地 址 传 给 线程 (如 图 
14.7 PRR). FERRARA TREE B 27 aT A REO Ke, LART EREE., 


一 个 进 径 


EE: AMAT 





Ala? 每 个 线程 都 拥有 一 个 指向 自己 结构 体 的 指针 


每 次 调用 现 数 count, words 之 后 都 会 接收 到 一 个 指向 不 局 结构 体 的 指针 .因此 线程 从 不 
同 的 文件 中 该 到 信息 ,并 对 不 辣 的 计数 器 进行 增 1 操作 。 因 为 结构 体 是 main 中 的 局 部 变量 ， 
所 以 分 配给 各 计数 器 的 内 存 空间 在 main 函数 返回 前 一 直 保 存 着 。 


14.3.3 线程 内 部 的 分 工 合作 : 小 结 


进程 的 数据 空间 包含 了 所 有 属于 它 的 变量 。 此 进程 中 运行 的 所 有 线程 都 拥有 对 这 些 恋 
量 访问 的 权限 。 如 果 这 些 变 量 值 不 变 的 活 RET CREME CONE. 

不 过 如 果 进 程 中 的 任何 线程 修改 了 一 个 变量 值 ,所 有 使 用 此 变量 的 线程 必须 采用 某 种 
策略 来 避免 访问 冲突 。 在 某 一 时 刻 ,只 有 惟一 的 线程 可 以 对 变量 进行 访问 。 

字数 统计 程序 的 三 个 不 同 版 本 显示 了 三 种 不 同 的 方法 来 进行 线程 间 的 变量 共享 。 在 
twordcountl. c 中 使 用 的 第 一 种 方法 ,人 允许 线程 无 任何 合作 来 修改 同一 个 变量 。 这 个 程序 本 
身 存在 着 很 大 问题 。 
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时 刻 , 只 有 惟一 的 一 个 线程 对 计数 器 进行 修改 ， 此 程序 里 然 解 况 了 问题 ,但 是 由 于 对 设置 利 
释放 互 斥 锁 太 多 的 调用 导致 了 系统 性 能 的 降低 。 

twordcount3. c 中 使 用 的 第 三 种 方法 是 一 种 改进 的 方法 。 此 方法 为 每 一 个 线程 创建 了 
各 自 的 计数 器 ,这 样 避免 了 共享 计数 器 的 麻烦 。 所 有 的 线程 不 需要 再 共享 一 个 变量 ,因此 也 
不 用 互相 合作 了 。 不 过 尽管 如 此 ,每 一 个 单独 的 线程 仍 需 和 原先 的 线程 进行 合作 。 特别 地 ， 
原 线程 不 应 在 其 他 线程 返回 之 前 读 取 它们 各 自 计 数 器 和 的 内 容 。 在 这 种 情况 下 , 诛 线程 使 用 
pthread join 汞 数 使 自己 挂 起 直到 线程 已 返回 。 当 某 一 计数 线程 返回 的 时 候 , 对 于 pthread_ 
join 的 调用 激活 原 线程 ,允许 其 访问 计数 器 并 且 也 告诉 main 函数 该 是 读 取 计数 器 值 的 时 
候 了 。 

第 二 个 版 本 的 程序 展 估 了 了 如何 传 递 客 个 参数 给 某 一 线程 中 的 函数 ， 即 先 创 建 一 个 结构 
类 型 变量 让 它 包含 所 有 的 参数 ,再 将 此 结构 体 的 地 址 传 给 函数 。 于 是 线程 可 读 取 或 修改 此 
结构 体 中 的 任意 成 员 变 量 了 。 任何 访问 此 结构 体 的 函数 都 可 以 看 见 值 的 不 断 变 化 。 当 然 ， 
如 朵 不止 一 个 线程 需要 修改 这 些 值 的 时 候 , 就 又 得 借助 于 于 不 量 来 避免 访问 冲突 了 。 


14.4 线程 与 进程 


Unix 从 其 产生 伊始 就 将 进程 作为 它 的 重要 组 成 部 分 而 线程 是 后 来 才 吉 进去 的 。 进 程 的 
概念 非常 清晰 且 统 一。 而 线程 却 有 着 一 系列 的 起 源 ,它们 的 属性 也 各 不 相同 。 这 里 的 例子 
用 了 一 个 是 做 POSIX 的 线程 接口 。 在 这 里 当然 忽略 了 效率 和 调度 的 问题 ,这 些 由 你 所 使 用 
的 Unix 版 本 和 线程 版 本 所 决定 。 

进程 与 线程 有 根本 上 的 不 同 。 每 个 进程 有 其 独立 的 数据 空间 .文件 描述 符 以 及 进程 的 

。 而 线程 共享 一 个 数据 空间 .文件 描述 符 以 及 进程 本 。 下 面 这 些 概念 对 于 程序 员 来 说 是 
tae 

(1) 共享 数据 空间 

这 里 考虑 一 个 在 存储 器 中 存储 了 巨大 而 复杂 的 树 结 构 数 据 库 的 数据 库 系 统 。 多 个 线程 
可 以 轻易 地 读 取 到 这 个 共享 的 数据 集 。 窜 户 的 多 个 查询 可 以 由 一 个 进程 来 实现 。 如 果 变 最 
不 会 被 改变 ,共享 这 个 数据 空间 不 会 导致 什 何 问题 。 

再 考虑 一 个 使 用 malloc 和 free 系统 调用 来 管理 内 存 的 程序 。 一 个 线程 分 配 了 一 块 空间 
存 坟 一 个 字符 申 。 当 此 线程 做 其 他 寺 情 的 时 候 , 另 一 个 线程 使 用 free BAT RAS. GE 
么 原先 的 线程 中 本 来 指向 此 空间 的 指针 现在 指向 了 一 块 已 经 被 释放 的 地 方 ,更 糟糕 的 是 ,这 
块 地 方 已 经 被 派 上 别 的 用 处 了 ，。 

线程 机 制 还 会 带 来 内 存 的 围 积 。 程 序 员 往往 因为 怕 影 响 了 某 线程 正在 使 用 的 内 存 空 
间 ,只 分 本 而 不 释放 存储 区 域 。 这 直接 导致 了 内 存 的 国 积 ,使 用 完毕 也 得 不 到 释放 

在 单线 程 环 境 中 返回 指向 静态 局 部 变量 的 指针 的 函数 无 法 兼容 于 多 线程 环境 。 央 为 
同样 

的 丽 数 可 能 在 多 个 线程 中 同时 被 调用 而 导 敏 结果 出 错 

简 而 言 之 ,如 果 共 享 的 变 基 很 党 且 定 义 的 不 好 ,调试 一 个 多 线程 的 应 y HUBER JE HEN: 
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(2) 共 涪 的 文件 描述 符 
在 fork 原 语 被 调用 之 后 ,文人 性 描述 符 自 动 地 被 复制 ,从 而 子 进程 得 到 了 一 套 新 的 文件 描 
述 符 。 在 子 进程 关闭 了 某 一 个 从 父 进 程 那里 继承 来 的 文件 描述 符 之 后 ,此 描述 符 对 父 进 各 
来 说 仍然 是 打开 的 。 

在 多 线程 程序 中 ,很 有 可 能 会 将 同一 个 文件 描述 符 传递 给 两 个 不 同 的 线程 。 即 传递 给 它 

们 的 两 个 值 指向 同一 个 文件 描述 符 ，。 显然 如 果 一 个 线程 中 的 函数 关闭 了 这 个 文件 ,此 
Pul. 

述 符 对 此 进程 中 的 任何 线程 来 说 都 已 经 被 关闭 。 然而 其 他 线程 或 许 仍然 需要 对 此 文件 
描述 符 的 连接 。 

(3) fork exec, exit. Signals 

所 有 的 线程 都 共享 向 一 个 进程 。 如 果 一 个 线程 调用 了 exec, 系统 内 核 用 一 个 新 的 程序 
取代 当前 的 程序 从 而 所 有 正在 运行 的 线程 都 会 消失 。 并 且 如 果 一 个 线程 执行 了 exit, RA 
个 进程 都 将 结束 运行 。 想 想 要 是 线程 的 运行 导致 了 内 存 段 异 常 或 者 系统 错误 或 是 线程 出 
E ERDER ,而 不 是 其 个 线程 本 身 了 。 

fork 创建 了 一 个 新 的 进程 ,并 把 原 调 用 进程 的 数据 和 代码 复制 给 这 个 新 的 进 穆 。 如 果 
线程 中 的 某 号 数 调用 了 fork ,那么 其 他 的 线程 是 不 是 也 会 被 复制 给 新 的 进程 呢 ? 答案 是 否定 
的 ,只 有 调用 fork 的 线程 在 新 的 进程 中 和 运行。 试想 一 下 如 果 在 fork 发 生 的 时 刻 , 另 一 个 线程 
正在 修改 数据 , 那 结果 如 何 呢 ? 在 什么 情况 下 这 些 数据 会 被 复制 到 新 的 进程 中 呢 ? 

信号 量 (Signal) 的 使 用 要 比 线程 复杂 多 了 。 进程 可 以 接收 任何 种 类 的 信 生 量 。 那么 哪 
些 线程 可 以 收 色 信号 量 ?” 是 不 是 所 有 线程 都 可 以 呢 ? RAS RR HAR HHRMA 
统 错误 引发 的 又 将 如 何 ” 线 程 与 信号 量 的 细节 可 参考 Unix 的 使 用 手册 ， 

(A) 动手 做 一 做 

这 一 章 介 绍 了 线程 的 基本 知识 .主要 问题 以 及 网 线程 程序 设计 细节 。 对 于 这 一 章 的 最 
好 的 练习 就 是 对 于 同一 个 问题 滩 计 两 种 不 同 的 解决 方案 ,一 个 使 用 线程 , 田 一 个 使 用 进程 。 
表 看 一 看 哪 一 个 容易 设计 ,编码 以 及 调试 ; 哪 一 个 运行 的 快 一 些 ; 哪 一 个 又 更 适用 与 兼容 
Unix 的 各 种 版 本 嘴 ? 


14.5 线程 间 互 通 消 息 


表 春 一 下 小 面 的 多 线程 字数 统计 程序 。 假 设 你 是 一 个 大 城市 选举 的 负责 人 。 城 市 中 小 
一 点 的 选区 很 快 就 完成 了 统计 票数 的 工作 ,然而 你 却 要 等 到 所 有 的 数字 都 出 来 之 后 才能 宣 
布 这 个 重要 的 结果 。 不 过 你 希望 在 每 个 选民 票数 出 来 之 后 立即 可 以 看 到 结果 。 

在 文件 中 统计 数字 就 像 是 选区 统计 票数 一 样 。 有 些 文件 比较 大 ,因此 就 需要 较 长 的 时 
间 来 做 统计 。 看 一 看 如 果 下 面 的 命令 被 运行 后 ,结果 是 什么 样 的 : 


twordcount really- big- file tiny- file 


原 线程 使 用 pthread wait 来 等 候 第 一 个 和 第 二 个 线程 返回 。 在 这 个 例子 当中 ,统计 第 
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一 个 文件 要 比 第 二 个 文件 的 时 间 长 的 多 。 那么 在 第 二 个 线程 完成 之 后 .如 何 来 通知 原 线 
程 呢 ? 

一 个 线程 是 如 何 与 另 一 个 线程 互通 带 息 的 呢 ? 在 一 个 计数 线程 完成 任务 之 后 , 它 基 如 
何 通知 原 线 各 它 的 结果 已 经 产生 了 呢 ? 对 于 进程 来 说 , 当 子 进程 终止 后 ,系统 调用 wait 返 
回 。 是 不 是 对 于 线程 的 处 理 也 有 类 似 的 机 制 呢 ? 某 个 线程 是 否 也 可 以 等 待 其 他 线程 完成 ? 
答案 是 否定 的 。 线 程 无 法 按照 这 种 方法 工作 。 因 为 对 于 线程 而 言 并 没有 父 线程 . 子 线 程 的 
袜 念 ,因此 并 不 存在 某 一 个 明显 的 线程 可 过 去 通知 。 


14. 5.1 通知 选举 中 心 


某 选 区 完成 计 票 后 ,将 其 结果 发 送 给 管理 中 心 看 一 下 下 面 的 这 个 方法 ,此 方法 是 用 来 从 
选区 得 到 选票 ,然后 将 其 发 送 给 管理 中 心 ( 也 许 看 起 来 有 些 古怪 ,不 过 线程 确实 就 是 用 这 种 
方法 来 与 另外 的 事件 互 拥 消息) 。 

CD 在 选举 中 心 有 一 个 投递 选举 报告 的 邮箱 。 这 个 邮箱 在 某 一 时 刻 只 能 接收 一 份 票数 
报告 。 
此 邮箱 前 有 -而 谋 巾 , 它 可 以 被 升 起 来 .但 很 快 就 会 被 多 复 至 原 位 。 

(2) 选举 中 心 尘 待 这 面 旅 帜 升 起 来 。 

(3) 某 选 区 负责 人 将 选区 统计 结果 放 人 邮箱 中 、 

(4) 某 选 区 负责 人 将 邮箱 的 旗帜 升 起 (发 送信 号) 。 

(5) ERP EEEIEE T PT ER 

* 从 邮箱 中 取出 选区 的 统计 报告 ; 

， 处 理 此 统计 报告 ， 

*。 回 到 原来 的 他 方 继续 等 待 , 即 循环 转 至 步骤 (2) 。 

上 上面 的 策略 起 初 看 起 来 有 些 古 怪 , 但 确实 很 有 意义 。 发 送 方 将 数据 存 人 容器 中 ，, 然 

后 升 起 一 面 旗帜 来 通知 接收 方 数 据 已 经 准备 好 了 。 

图 14. 8 清楚 地 展现 了 选举 中 心 与 两 个 选区 之 同 的 关系 。 每 一 个 选区 将 自己 的 报告 放 和 人 
邮箱 中 ,然后 通知 选举 中 心 来 取 。 最 后 选举 中 心 处 理 了 报告 。 在 这 个 例子 中 升旗 帜 的 技术 
术语 叫做 发 送信 号 , 即 接收 方 在 等 竺 信号 的 到 来 。 当 然 ,这 里 只 是 个 比喻 ,对 旗帜 的 操作 与 
Unix 里 的 信号 量 机 制 一 点 关系 也 没有 ,两 者 仅仅 是 基本 思路 相同 而 已 , 


条 件 标记 
一 报告 信箱 







wep ERI 选区 2 
图 14.8 使 用 加 锁 的 邮箱 来 传递 数据 
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了 从 图 14. 8 中 还 可 以 看 到 另外 一 样 东西 : 邮箱 上 有 一 把 锁 。 邮 箱 仅 仅 可 以 容纳 一 份 报 
告 , 因 此 在 某 个 时 刻 只 能 有 一 人 拥有 对 邮箱 访问 的 权限 。 昌 然 锁 的 加 入 使 邮箱 结构 看 起 来 
有 些 复杂 ,但 却 使 得 邮箱 相当 可 车 。 使 用 锁 机 人 制 的 邮箱 系统 ,其 完整 的 过 程 如 下 . 

C1) 选举 中 心 建 一 个 投递 选举 报告 的 邮箱 。 

此 邮 逢 在 某 个 时 刻 只 能 容纳 一 份 选举 报告 

此 邮箱 旁 有 一 面 旗帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

此 邮箱 有 一 把 互 乒 的 锁 , 可 以 被 锁 住 或 打开 。 

(2) 选举 中 心 将 邮箱 锁 打 开 , 然 后 等 待 旗帜 信号 的 到 来 。 

X € pof vr A Se TC Bde D. EA E Ur EUR BER BET 

An SE ER dE as ,选区 负责 人 先 将 邮箱 锁 打 开 , 等 待 着 旗帜 信号 的 到 来 ,然后 再 将 邮箱 
锁 住 。 

选区 负责 人 将 选举 报告 放 人 邮箱 中 。 

(3) 选区 负责 人 将 旗帜 升 起 ,把 信号 发 出 去 ， 

选区 负责 人 把 邮箱 上 的 锁 打 井 。 

(4) 选举 中 心 看 到 旗帜 信号 ,停止 等 待 。 

选举 中 心 锁 住 邮箱 。 

选举 中 心 将 选举 报告 拿 出 。 

选举 中 心 处 理 该 选举 报告 。 

选举 中 心 升 起 旗帜 ,以 防 其 一 选区 负责 人 已 经 等 待 了 很 久 。 

选举 中 心 转 向 步骤 (2) 。 


14.5.2 使 用 条 件 变 量 编 写 程序 


下 面 将 计算 投票 数目 的 系统 转换 成 宁 数 统计 的 程序 。 计 票 系统 使 用 了 .种 设备 ; 容器 、 

旗帜 和 锁 。 这 三 种 不 同 的 设备 对 应 了 线程 编程 中 的 三 项 : 一 个 变量 保存 数据 .一 个 条 件 
MRA TERR. Al 9 展示 了 三 个 线程 和 三 个 变量 。 一 个 变量 用 作 指 向 字数 计数 器 的 
指针 ,一 个 变量 用 作 条 件 对 象 ,而 另 一 个 变量 用 作 互 斥 量 。 

研究 一 下 程序 的 内 在 逻辑 。 原 线程 甩 动 了 两 个 计数 线程 然后 开始 等 待 结果 的 到 来 。 特 
SN dh, BR eR AAA FA pthread_cond_wait 熙 数 来 等 待 " 许 炽 升 起 "这 个 系统 调用 将 原 线程 

当 某 一 计数 线程 完成 计数 后 ,此 线程 通过 把 指针 存 和 “邮箱 ”变量 的 方法 来 传递 结果 。 
首先 ,此 线程 对 此 邮箱 加 锁 ; 然 后 线程 恰 查 邮箱 ;如 果 上 邮箱 非 空 ,线程 把 邮箱 镇 打 升 并 等 待 着 
信号 的 到 来 ;之 后 ,线程 峡 一 次 把 邮箱 锁 住 ,并 把 结果 放 人 邮箱 ;最 后 ,计数 线程 调用 了 函数 
bthread_cond_signal ,将 条 件 变 量 flag 这 面 “旗帜 ? 升 起 来 。 

此 时 由 于 执行 pthread_cond_wait 而 挂 起 等 待 条 件 变量 flag 变化 的 原 线程 被 计数 线程 
发 出 去 的 信号 唤醒 了 。 原 线程 急切 地 想 冲 过 去 打 井 邮箱 ,然而 此 时 的 邮箱 仍然 被 计数 线程 
锁 在 那里 。 

当 计 数 线程 通过 调用 pthread mutex_unlock 把 邮箱 锁 打 并 之 后 , 原 线 程 终 于 得 到 了 对 
这 把 锁 的 控制 权 。 虎 线程 将 选举 报告 从 邮箱 中 拿 出 来 ,在 屏幕 上 显示 出 来 ,再 将 其 加 到 总 数 
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中 去 。 然 后 原 线 程 发 出 信号 ,以 防 别 的 计数 线程 正在 等 待 。 最 后 原 线程 循环 回去 ,继续 调用 
pthread_cond_wait 函数 ,自动 将 互 斥 量 解锁 ,并 将 自己 挂 起 直到 下 一 次 的 信号 到 来 。 

上 面 一 段 所 讨论 的 步骤 恰好 对 应 于 投票 系统 的 原型 ,也 同样 对 应 于 下 面 将 看 到 的 
twordcount4. c 中 的 代码 


/* twordcount4.c - threaded word counter far two Files. 
* - Version 4; condition variable allows counter 
* functions to report results early 


N 


f$ include <stdio. h> 
# include < pthread. h> 
BH include <ctype. h> 


struct arg_set { /* two values in one arg ¥/ 
char » fname; /x file to examine */ 
int count; /* number of words +/ 


Hs 

struct arg set x mailbox; 

pthread mutex_t lock = PTHREAD MUTEX INITIALIZER; 
pthread cond t flag = PTIREAD COND INITIALIZER; 


main(int ac, char » av[]) 


( 


pthread E tl, t2; /* two threads «/ 
struct arg set argsl, args?; /« two argzets «/ 
void x count words(void *); 


int reports in = 0; 


, 
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int total words = 0; 


F 


if (ac!= 3) 
printf("usage; Xs filel file2\n", av#(0]; 
exit(1); 
} 
pthread mutex lock(&lock); /* lock the report box now x/ 


argsl.fname = av[1]; 
argsl.count = Q; 


pthread create(&tl, NULL, count words, (void * ) &argsl); 


args2.fname - av[2]; 


Ü. 


, 


argsz.count 


pthread create(&t2, NULL, count words, (void * ) &args2); 


while( reports in < 2 2| 
printf("MAIN. waiting for flag to go up\n"); 
pthread cond wait(&flag, &lock); /* wait for notify */ 
printf( "MAIN, Wow! flag was raised, I have the lock\n") ; 
printf("% 7d, % s\n", mailbox- —count, mailbox- > fname); 


total words += mailbox- count; 


if ( mailbox == &argsl) 
pthread _join(t1,NULL); 
if ( mailbox == &args2) 


pthread join(t2, NULL); 
mailbox = NULL; 
pthread cond signal(Sflag); 
reports int; 


} 


printf("% 7d; total words\n", total words); 


void x count words(void + a) 


{ 


struct arg set * args = a; /* cast arg back to correct type */ 
FILE * fp; 
int c, prevec = "AQ'. 


if ( (fp = fopen(args- —fname, "r"))!- NULL | 
while( ( c = getc(fp))(= EOF ){ 
if ( ! isalnum(c) && isalnum(prevc) ) 
args 一 —count-ti ; 


preve = c; 


’ 
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} 

fclose(fp); 
} else 

perror(args - fname); 

printf("COUNT. waiting to get lock\n"); 
pthread mutex lock(&lock); /* get the mailbox */ 
printf("COUNT, have lock, storing data\n") ; 
if € mailbox! = NULL) 

pthread cond wait(&flag,&lock); 
mailbox - args; /* put ptr to our args there x/ 


printf( "COUNT, raising flag\n"); 


pthread cond signal(&flag); /* raise the flag */ 
printf( "COUNT, unlocking bosn"); 

pthread mutex unlock(&lock); /* release the mailbox x/ 
return NULL; 


FARETE T Id) AI : 


$ cc twordcount4.c ~ lpthread -a twcå 

S ./twed /etc/group /usr/dict/ words 

COUNT; waiting to get lock 

MAIN; waiting for flag to go up 

COUNT; have lock, storing data 

COUNT, raising flag 

COUNT. uniocking box 

MAIN. Wow! Flag was raised, I have the lock 
195; /etc/group 

MAIN, waiting for flag to go up 

COUNT; waiting to get lock 

COUNT. have lock, storing data 

COUNT, raising flag 

COUNT, unlocking box 

MAIN; Wow! fiag was raised, I have the lock 
45419, /usr/dict/wards 

45614. total words 


14.5.3 使 用 条 件 变量 的 函数 


在 邮箱 上 用 来 通知 其 他 线程 的 旗帜 就 是 一 个 条 件 变 量 。 下 面 函 数 的 作用 就 是 使 用 条 件 
变量 进行 通信 。 
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ee 
pthread_cond_wait 














目标 使 线程 挂 起 ,等待 其 条 件 变量 的 信号 
Lee # include < pthread, h> 
RB int pthread cond wait (pthread_cond_t * cond, 


pthread_mutex_t * mutex); 


参数 cond 48 ot AR (ERE P HE 
mutex 指向 互 斥 锁 对 象 的 指针 
返回 值 0 成 功 返 回 
errcode 错误 


pthread cond wait 使 线程 挂 起 直到 另 一 个 线程 通过 条 件 变 量 发 出 消息 。pthread_cond 
wait 函数 总 是 和 互 斥 锁 在 一 起 使 用 。 此 函数 先 自动 释放 指定 的 锁 , 然 后 等 待 条 件 变 晤 的 变 
化 。 如 果 在 调用 此 级 数 之 前 , 妞 斥 量 mutex 并 没有 被 锁 住 ,函数 执行 的 结果 是 不 确定 的 。 在 
返回 原 调 用 函数 之 前 ,此 函数 自动 将 指定 的 开 厂 量 重 新 锁 住 。 


pthread_cond_signal 





























目标 醋 配 一 个 下 在 等 候 的 线程 
3 # include wot. h> 
函数 原型 int phre kond enel prmesd. cond A * cond); 
参数 cond 指向 某 条 件 变量 的 指针 。 
JE E ik o 成 功 返回 
errcode 错误 


pthread_cond_signal 晒 数 通过 条 件 变量 cond RIA. AMAR EARTH EU ABA 
会 发 生 ; 若 是 多 个 线程 都 在 等 待 ,只 唤醒 它们 中 的 一 个 。 


14.5.4 回 到 Web 服务 器 例子 


通过 前 面 的 学 习 , 大 家 已 经 了 解 了 POSIX 线程 系统 最 基本 知识 和 技 三 ,包括 如 何 创 建新 
的 线程 ,如何 等候 线程 返回 、 如 何 安 全 地 在 线程 间 共 享 数 据 以 及 线程 如 傈 与 其 他 线程 互通 消 
E. 相信 大 家 已 经 有 是 够 多 的 知识 可 以 完成 Web RS BAR ech ie 9 BITE. 


14.6 多 线程 的 Web 服务 器 


前 面 的 章节 已 经 写 了 一 个 Web 服务 器 的 程序 。 服 务 器 使 用 fork 系统 调用 创建 新 的 进 
程 来 处 理 客 户 端的 请 求 。Web 服务 器 需要 完成 三 种 操作 :将 目录 列表 返回 ;将 文件 内 容 返 
加 ;以 及 将 CGI 程序 的 输出 返回 。 

服务 器 需要 新 的 进程 来 运行 CGI 程序 ,但 是 并 不 需要 新 的 进程 来 读 取 月 录 列 表 和 文件 
PE. 
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14.6.1 Web 服务 器 程序 的 改进 


这 里 对 前 一 个 版 本 的 Web 服务 器 程序 作 了 很 多 修改 。 最 重要 的 是 使 用 函数 pthread _ 
create 替换 了 fork。 在 新 的 版 本 中 客户 端的 请 求 不 再 由 单独 的 进程 来 处 理 , 而 是 由 同一 进程 
的 多 个 线程 来 处 理 。 

另外 还 做 了 两 个 改动 :首先 , 移 除了 CGI 的 功能 。 后 面 的 章节 会 把 这 个 动能 加 上 去 。 其 
次 ,自己 写 了 一 个 对 自 沪 进行 列表 的 两 数 ,而 以 前 的 版 本 是 通过 调用 exec 执行 标准 1s 命令 来 
完成 对 昌 录 的 列表 的 。 


14.6.2 在 多 线程 的 版 本 允许 一 个 新 的 功能 


多 线程 的 特性 允许 我 们 洪 可 一 个 新 的 功能 ;内 部 统计 。 服 务 器 的 运行 者 通常 希望 知道 
服务 区 的 运行 时 间 ,接收 的 客户 端 请 求 的 数 日 以 及 发 送 回 客户 端的 数据 量 。 

国 为 对 于 所 有 的 请 求 共 享 内 存 空 间 , 可 以 使 用 共享 变量 的 方式 来 进行 统计 。 那 么 用 户 
如 何 访问 这 些 统计 数据 呢 ? 这 里 如 和 一 个 特殊 的 URL: status。 当 远程 用 户 请 求 此 URL 
时 ,服务 器 将 内 部 的 统计 数据 发 给 客户 端 。 


14.6.3 BRIER P&E (Zombie Threads) :独立 线程 


现在 来 考虑 男 一 个 技术 细节 。 本 章 中 所 提 到 所 有 的 程序 中 都 使 用 了 pthread, join 少数 
来 等 待 线程 返回 。 每 个 线程 都 占用 了 系统 资源 。 如 果 程 序 员 忘记 使 用 pthread join 来 收回 
线程 ,这 些 被 线程 所 占用 的 资源 就 无 法 被 回收 ,类 似 于 用 malloc 米 分 配 的 空间 却 没 有 用 free 
释放 掉 -- 样 。 

在 字数 统计 的 程序 中 , 原 线程 不 得 不 等 待 折 有 的 计数 线程 返回 之 后 , 才 可 以 收集 数据 。 
然而 Web 服务 器 却 没 有 理由 等 竺 处 理 请 求 的 线程 返回 。 因 为 原 线程 不 需要 从 这 些 线程 得 到 
任何 返回 数据 。 

这 里 同样 可 以 创建 不 需要 返回 的 线程 , 称 之 为 独立 线程 (Detached Threads), H RH, 
行 完毕 之 后 ,独立 线程 自动 释放 它 所 占用 的 所 有 的 资源 ,它们 自身 甚至 也 不 允许 等 待 其 他 的 
线程 返回 。 可 以 通过 传递 一 个 特殊 的 属性 参数 给 站 数 pthread cercate 来 创建 一 个 独立 线程 。 

/* creating a detached thread */ 

pthread t t; 

pthread attr t attr detached; 

pthread attr init(&attr detached); 

pthread attr setdetached(&attr detached,PTHREAD CREATE DETACHED); 

pthread create(&t,&attr detached,func,arg); 


14.6.4 Web 服务 器 代码 
采用 多 线程 方法 实现 Web 服务 器 的 完整 代码 如 下 ， 


/ * twebserv.c — a threaded minimal web server (version D.2) 
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= 


xX 


* 


* 


x 


* 


*; 


usage; tws portnumber 
features. supports the GET command only 
runs in the current directory 
creates a thread to handle each request 
Supports a special status URL to report internal state 


building, cc twebserv.c socklib.c - lpthread - o twebserv 


i 


it include <(stdio. k> 


it include <sys/types.h> 


# include <isys/stat. h= 


# include — string. h> 


# 
# 


include << pthread. h>> 


include «stdlib. ho 


# include —unistd. h> 


# include <dirent. h> 


# include < time. h> 


fs 





server facts here x/ 


time t server started ; 


int server bytes sent; 


int server requesta; 


main(int ac, char x av| 


1 


int sock, fd; 
int * fdptr; 
pthread t worker; 
pthread at&ttt; 


void * handle call(void *); 


if (ac 2-1 }f 
fprintf(stderr, usage: tws portnum\n") ; 
exit(1): 

} 

sock = make server_socket( atoi(av|1l]|)); 


if ( sock == - 1) 1 perror( "making socket"); exit(2); } 
setup(&attr); 
/* main loop here, take call, handle call in new thread +/ 


while¢1) { 
fd = accept( sock, NULL, NULL ) 


E 


server requests tt - 
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} 


ix 


fdptr = mallec(sizeof(int)); 
* fdptr = fd; 
pthread_create(&worker, &attr, handle_call,fdptr) ; 


» initialize the status variables and 


x set the thread attribute to detached 


Zi 
setup(pthread attr t * attrp) 


{ 


} 


pthread attr init(attrp); 


pthread attr setdetachstate(attrp,PTHREAD CREATE DETACHED); 


time(Sserver started); 
Server requests = 0; 


server bytes sent = 0; 


void * handle callívoid »* fdptr) 


{ 


x 


FILE x fpin; 
char request|BUFSIZ]; 
int fd. 


r 


fd = + (int x }fdptr; 
free(fdptr) ; /* get fd from arg «/ 


fpin = fdopen(fd, "r"); /* buffer input */ 

fgets( request , BUFSIZ,fpin) ; /* read client request «/ 
printf("got a call on $d; request = $s", fd, request); 
skip rest of header(fpin); 


process rq(request, fd); /* process client rq */ 


fclose(fpin); 





skip rest of header(FILE *) 
Skip over all request info until a CRNL is seen 





Skip rest of header(FILE x* fp) 


{ 


charbef[BUFSIZi-[/; 


while( fgets(buf,BUFSIZ,fp) !- NULL && strcmp(buf, "\r\n,") 
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At poe ee) Y- dnas x 
process_rqt char s rg, int fd } 
do what the request asks for and write reply to fd 
handles request in a new process 
rq is HTTP command; GET /foo/bar. html HTTE/1.0 


re — 22220 ee Y 





process rj( char * rq, int fd) 
{ 
char cmd[ BUFSIZ}, arg[BUFSIZ]; 


if ( sscanf(rq, ,"&s$s,", cmd, arg) [= Z) 


Li 
return; 
sanitize(arg); 


printf("sanitized version is % s\n", arg); 


if ( stremptemd, "GET") |= 0) 
not implemented(); 
else if ( built in(arg, fd) ) 
else if ( not exist( arg) ) 
do 404(arg, fd); 
else if ( isadir( arg ) ) 
do ls( arg, fd); 
else 
do cat( arg, fd); 
} 
/* 
* make sure all paths are below the current directory 
x/ 
sanitize(char * str) 
{ 


char * src, * dest; 
src = dest = str; 


while( x src Jl 


if ( strncmp(src, "/.. /",4) -- 0) 


sre += 3; 
else if ( strnomp(src,"//",2) ==0 ) 
Src4*; 


else 
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*xdesttt = #srctt; 
1 
t 
xdest = ,'\0,'; 
if ( str =='/' 3 


strepy(str,str + 1); 


if € str[0; == '\O’ || stremp(str,"./") -- 0 
|| stremp(str,". /.. "3 20) 


strcpy(Cstr,". "); 


/* handle built - in URLs here. Only one so far is "status" x/ 
built in(char * arg, int fd) 
{ 

FILE * fp; 


if ( stremp(arg, status") !- 0} 
return 0; 


http replv(fd, &fp, 200, "UK", "text/plain", NULL); 


fprintf(fp,"Server started, & s", ctime(&server started)); 


fprintf(fp,"Total requests. & d\n", server requests); 


fprintf(fp,"Bytes sent out, &dXn", server bytes sent); 


了 


fclose(fp) ; 


return 1; 


http reply(int fd, FILE x» x*fpp, int code, char *msg, char + type, char « content) 
1 

FILE *fp = fdopen(fd, "w"); 

int bytes = 0; 


if fp |= NULL ){ 


bytes = fprintf(fp,"HTTP/1.0 $d %s\r\n", code, msg); 
bytes += fprintf(fp,"Content- type, * s\r\n\r\n", type); 
if ¢ content ) 
bytes += fprintf(fp," & sNrin", content) ; 
; 
fflush(fp); 
if ( fpp > 
*fpp = fp; 
else 
fclose(fp): 


return bytes; 
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simple functions first, 
not implemented(fd) ^ unimplemented HTTP command 
and do 404(item,fd) no such object 


Ee c uec mc E teer eset EU LIE rt ius e ee eit 


not implemented(int fd) 


{ 
http reply(fd,NULL,501,"Not Implemented", "Lext/plain" 


"That command is not implemented"); 


do 404(char » item, int fd) 


{ 
http_reply(fd,NULL,404, "Not Found", "text/plain", 
"The item you seek is not here"); 





jr T ———— me Sa m dee uec * 
the directory listing section 


isadir() uses stat, not exist() uses stat 





一 一 一 一 一 一 一 一 一 一 一 一 mm 一 - as = eo J Se a 


isadir(char x fj 
{ 
struct stat info; 


return ( stat(f, &info) |= - 1 && 8 ISDIR(info.st mode) ); 


not exist(char x f) 


struct stat info; 
returni stat(f,&info) == -1 }; 


do ls(char x dir, int fd) 


f 
L 


DIR 关 dirptr; 

struct dirent æ direntp; 
FILE + fp; 

int bytes = 0; 


bytes = http reply(fd,&fp,200, "OK", "text/plain", NULE) ; 
bytes += fprinti(ip, “Listing of Directory $ s\n", dir); 


if ( (dirptr = opendir(dir)) t= NULL ){ 
whilet direntp = readdir(dirptr) )! 


第 14 章 BENA: 并 发 函数 的 使 用 * 451 





bytes += fprintf(fp, "%* s\n", direntp- —d name), 
] 
closedir(dirptr); 
} 
fclose(fp); 


server bytes sent += bytes; 





functions to cat files here. 


file type(fileneme) returns the 'extension'. cat uses it 





- 一 - d x/ 


char * file type(char * f) 
{ 
char * cp; 
if C (ep = strrchr(f,'. ' )) !- NULL) 
return cpt 1; 


return" -"; 


4 
/* do_cat(filename, fd), sends header then the contents */ 


do cat(char x f, int fd) 

1 
char x extension = file type(f); 
char + type = "text/plain "; 
FILE + fpsock, x fpfile; 
intc; 


intbytes - 0; 


if ( stremp(extengion, "html ") ==0 ) 
type = "text/html"; 

else if ( strcmp(extension, "gif") ==0) 
type = "inage/gif"; 

else if ( strcmp(extension, "jpg") ==0 ) 
type - "image/jpeg"; 

else if ( strcmp{extension, "jpeg") ==0 ) 


type = "image/jpeg"; 
fpsock = fdopen(fd, "w"); 
fpfile = fopen( f , "r"); 


if ( fpsock |= NULL && fpfile !- NULL) 

{ 
bytes = http_reply(fd, &fpsock, 200, "OK", type, NULL) ; 
while( (c = getc(fpfile) ) 1= EOF | 
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putc(c, fpsock); 
bytes ++ ; 


L 
f 


fclosetfpfile); 
fclose(fpsock); 

} 

server_bytes_sent += bytes; 


} 


He E 9A E BIE BT IE GEEA bA: rh Sh RE dds (ERE 
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14.7 线程 和 动画 


Web 服务 器 程序 不 需要 线程 也 可 以 工作 ,因为 可 以 使 用 fork 来 处 理 并 发 的 请 求 。 然 而 
如 果 没 有 引 人 人 线程 机 制 , Web 浏览 器 却 无 法 轻易 地 使 画面 和 广告 动 起 来 。 对 线程 的 下 一 个 
应 用 是 如 何 用 多 线程 来 控制 动画 。 

在 视频 玄 戏 那 一 章 中 ,使 用 了 和 定时 器 来 控制 动画 。 定 时 器 以 一 个 特定 的 时 间 冰 隔 来 发 
送 SIGALRM 消息 ,信号 处 理 者 使 用 计数 器 来 决定 何 时 移动 图 片 。 


14.7.1 使 用 线程 的 优点 


信号 处 理 者 和 定时 融 的 机制 虽然 可 以 完成 .L 作 ,但 线程 机 制 史 好 地 匹配 了 内 部 和 外 部 的 结 
构 。 在 外 部 ,用 户 可 以 看 见 黄 个 独立 的 活动 流程 : 动 通 和 键盘 控制 ,如 图 14. 10 Bro, 


动画 线程 会 用 到 关于 
MENS 





zirection = | 
pee 1] 


ee Me aa a 
会 修改 动画 的 设置 


图 14.10 动画 图 片 及 其 键盘 控制 


在 内 部 ,线程 可 以 将 控制 动画 代码 和 键盘 输入 代码 分 开 。 如 图 14. 11 Bron ,线程 间 通 过 
共享 变量 方式 定义 位 置 .动画 速度 ， 

当然 ,画面 的 移动 还 是 通过 隐藏 的 定时 器 来 完成 的 ,但 多 线程 的 解决 方案 证 我 们 更 关注 
于 程序 的 组 织 结构 。 

多 线程 与 原先 的 方法 相 比 还 有 另外 个 好 处 。 现 代 的 线程 库 允 许 不 同 的 线程 运行 在 不 
同 的 处 理 器 芯片 上 ,从 而 实现 了 真正 意义 上 的 并 行 。 对 于 动画 而 言 , 其 轨道 .旋转 以 及 纹理 
的 绘制 都 需要 复杂 的 计算 ,因此 在 多 个 处 理 器 上 运行 线程 可 以 提供 更 快 的 处 理 速度 和 更 加 
T8 8 AY) AT. 
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键盘 线程 动画 线程 
图 14. 11 动画 线 程 及 键盘 线程 


14.7.2 多 线程 版 本 的 bounceld.c 
比较 一 下 原先 版 本 bounceld. c 与 新 的 两 线程 版 本 tbounceld. c 的 区 别 : 


/* h tbounceld. c, controlled animation using two threads 


x note one thread handles animation 

à other thread handles keyboard ínput 

+ compile cc tbounceld.c - lcurses - lpthread - o tbounceld 
*/ 


# include <stdio.h> 

H include <ecurses. h> 
# include <prhread. h> 
* include <stdlib.h> 
$8 include «unistd. h> 


/* shared variables both threads use. These need a mutex.4/ 


# define MESSAGE " hello" 


int row; /* current row x/ 
int col; /* current column «/ 
int dir; /* where we are going */ 
int delay; /* delay between moves »/ 
main() 
{ 
int ndelay; /* new delay x/ 
int €; /* user input »/ 
pthread t msg thread; /* à thread «/ 


void # moving msg(); 


initscr(); /* init curses and tty «/ 
crmode() ; 


noecho() ， 
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clear(); 

row = 10; /* start here «/ 

col - 0; 

dir = 1; /* add 1 to row number «/ 
delay = 200; /* 200ms = 0.2 seconds «/ 


if ( pthread create(&msg thread, NULL,moving msg,MESSAGE) )| 
fprintf(stderr, "error creating thread"); 


endwint) > 


exit(0); 
} 
while(1) { 
ndelay = 0; 
c = getch(); 
if Cc == 'Q! ) break; 
ifle == ' ') dir = -dir; 
if {c == 'f' && delay > 2 ) ndelay ^ delay/2; 
if (c == ‘'s') ndelay = delay * 2 ; 
if ( ndelay > 0} 
delay - ndelay ; 
} 


pthread_cancel(msg_thread) ; 
endwin(), 


} 


void x moving msg(char + msg) 


{ 


while( 1) | 
usleep(delay * 1000); /* sleep a while x/ 
move( row, col); : /* set cursor position x/ 
addstr( msg ); / * redo message x/ 
refresh(); /* and show it */ 


/* move to next column and check fer bouncing x/ 


col += dir; /* move to new column x/ 
if { càl < = 0 && dir == -1) 

dir = 1; 
else if ( col + strlen(msq) = = COLS && dir == 1} 

dir- -1; 


新 版 本 的 动画 程序 与 老 版 本 的 单线 程 程序 有 何 区 别 昵 ?最 大 的 不 同 之 处 在 于 main PR 
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数 中 创建 了 一 个 新 的 线程 来 执行 moving msg PASE. moving msg 函数 执行 了 一 个 简单 的 循 
YR :sleep, move, RF PERK. repeat, HM, 3E [5] — 3E £2 039 75 — E A3 , main 函数 也 执行 一 个 简 
单 的 循环 :getcb, 处理 ,repeat。 

修改 后 的 程序 仍然 用 全 局 变量 表示 球 的 状态 。 在 基于 中 断 的 版 本 中 ,必须 使 用 全 局 变 
量 ,因为 无 法 将 参数 传 给 信号 处 理 者 。 然 而 线程 机 制 却 允许 线程 接收 参数 ,因此 可 以 像 上 面 
字数 统计 程序 的 第 三 .第 四 版 本 一 样 . 通 过 创建 结构 体 , 并 将 其 地 址 传 给 线程 的 方式 来 改进 
RH. 
14.7.3 基于 多 线程 机 制 的 多 重 动画 : tanimate. c 

怎样 才 可 以 同时 使 多 条 消息 活动 起 来 呢 ? 多 线程 的 字数 统计 程序 并 发 地 运行 了 多 个 字 
数 统 计 消 数 的 实例 ,每 一 个 调用 部 传递 给 此 函数 一 个 文件 名 和 一 个 独立 的 计数 占 。 用 同样 
的 道理 可 以 运行 并 行 的 动画 ， 

下 面 的 多 线程 动画 程序 tanimate.c 是 cbouncel. c 的 一 个 扩展 。tanimate,c 最 多 可 以 接 
Z 10 个 命令 行 的 参数 ,使 每 一 个 参数 在 不 同 的 行 上 移动 ,并 且 有 自己 独立 的 速度 和 方向 。 例 
如 .下 面 的 命令 


tanimate 'Buy this' "Drive this car' 'Spend Money here’ Consume '1Buy! ' 


将 产生 一 个 包含 多 种 跳动 的 动画 消息 ,如 图 14. 12 所 示 。 








Spend money here! 
Consume! 





Puy! 





图 14.12 多 种 跳动 的 动画 消息 


用 户 可 以 通过 按键 “0”“12 等 使 处 在 该 行 上 的 消息 跳动 

也 可 以 使 一 组 字符 串 活 动 起 来 ,甚至 是 那些 Unix 的 工具 ,可 以 尝试 下 面 的 命令 ， 
tanimate 'la' 

tanimate ‘users' 


tanimate 'date' 


tanimate 在 不 同 的 线程 中 运行 控制 动画 的 函数 。 这 个 函数 的 每 一 个 实例 都 接收 到 原始 
线程 所 传 的 一 组 不 同 的 参数 。 人 参数 指 定 了 消息 名 称 . 行 号 .移动 方向 以 及 速度 : 


/*^ tanimate.c; animate several strings using threads, curses, 
* usleep() 
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* 


* bigidea one thread for each animated string 


* one thread for keyboard control 

* shared variables for communication 

* compile ec tanimate.c — lcurses - lpthread - o tanimate 
* to do needs locks for shared variables 

x nice to put screen handling in its own thread 

ae 


it include < stdio. hz» 
# include «curses. h> 
# include < pthread. h> 
# include < stdlib. h= 
# include <_unistd. h= 


# define MAXMSG 10 /* limit to number of strings x/ 
+ define TUNIT 20000 /* timeunits in microseconds x/ 


struct propset { 


char * str; /* the message x/ 

int row; /* the row «/ 

int delay; /* delay in time units #/ 
int dir; /* *1o0r-1*»/ 


pthread mutex t mx = PTHREAD MUTEX INITIALIZER; 


int main(int ac, char * av| |) 


1 


int C; /* user input #/ 

pthread t thrds[ AXMSG | » /* the threads x/ 

struct propset  props[ AXMSG]; /* properties of string */ 
void * animate(); /* the function »/ 

int num msg ; /* number of strings */ 
int i; 


了 


if (ac == 1) 
printf("usage; tanimate string..\n"); 


exit(1); 


num msg = setup(ac- 1,av-* l,props); 


/* create all the threads */ 
for (i=0 :ii< num msg; i++} 
if ( pthread_create(&thrds[i}, NULL, animate, &props[i!)}! 
fprintf(stderr, "error creating thread"); 


endwin(): 





PHE 线程 机 制 : JEU HE FH 


ee. —— ———— 


exit(0): 


} 


/* process user input x/ 


while(i) | 
c = getch(); 
if (c == 'Q') break; 
if (cc == ' ') 
for (i= 0;i<cnum_msg;i++ > 
props|i].dir = - props[i]. dir; 
if (c= ‘0' Ec <= '9' h 
i =e- '0'; 
if ( i < num_nsg } 
props[iJ].dir = - props[il dir; 


一 一 


/* cancel all the threads »/ 

pthread_mutex_lock( &mx) ; 

for (iz 0; ic num msg; i++ } 
pthread cancel(&hrds[ i]}; 

endwin(); 

return 0; 


i 


int setup(int nstrings, char « strings| |, struct propset props| |) 


{ 


int num msg = ( nstrings D> MAXMSG ? MAXMSG ; nstrings ); 


int i; 


/* assign rows and velocities to each string */ 


srand(getpid()); 

for(i-0 , i< num msg; i++); 
props[i].str = strings[il; 
preps[ i] row = i; 
props|i].delay = 1+ (rand() €15); 
props[i].dir = ((rand() %2)? 1.- 

} 


/* set up curses x/ 

initser(); 

crmode(); 

noecho() : 

clear(); 

mvprintw (LINES-1,0,"'O' to quit, '0* 


num msg - 1); 


/* the message */ 
/* the row x/ 
/* a speed «/ 


1); /* tlor -1«/ 


.. '%d? to bounce", 





d 
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return num msg; 


} 


/* the code that runs in each thread */ 
void x» animate(void » arg? 


i 


à 


struct propset x info - arg; /* point to info block */ 
int len = strlen(info- str) +2; ¿»+ +2 for padding «/ 
int col = rand} $ (COLS - len- 3); /* space for padding x/ 
while( 1 ) 


H 
usleep(info - 7 delay * TUNIT); 


pthread mutex lock(&mx); /* only one thread «/ 
novel info- ~>row, col); /* can call curses */ 
addch(" "9. l /* at the same time x/ 
addstr( info- “str }; /* Since I doubt it is */ 
addeoh(' '); /* reentrant «/ 
move( LINES - ],COLS - 02; /* park cursor */ 
refresh(); /* and show it */ 

pthread mutex unlock(&mx); fe donewith curses */ 


/* move item to next column and check for bouncing x^ 


col + = info- dir; 


if (col <0 = 0 && info- dir == -1) 
info- dir = 1; 
else if (col + len “> = COLS && info- ~>dir == 1) 
info- —dir = - 1i; 


14.7.4 tanimate.c 中 的 互 斥 量 


上 面 的 程序 ,整个 代码 分 为 三 段 :初始 化 .控制 移动 消息 的 函数 和 一 个 读 取 和 处 理 用 户 
输 人 的 循环 。 用 户 输 和 人 循环 在 初始 线程 中 运行 ,而 控制 动画 的 函数 却 是 运行 在 好 几 个 线程 
中 。tanimate 可 以 最 多 同时 有 11 个 线程 在 运行 。 在 线程 并 行 运行 过 程 中 ,共享 资源 是 什么 ? 
X A fp oc E 1b EXER [91 P9) 3c 5 p R e? 

1. 数据 冲突 : 互 斥 量 的 动态 初始 化 

控制 动画 的 函数 可 以 使 用 或 修改 作为 参数 传递 给 它 的 结构 体 成 员 的 值 ,它们 包括 位 置 、 
速度 以 及 运动 方向 。 妆 用 户 使 一 条 消息 跳动 之 后 ,输入 线程 修改 了 结构 体 中 成 员 dir 的 值 。 
大 家 都 知道 ,共享 变量 需要 互 斥 量 来 防 正 数据 的 冲突 。 那 么 是 但 需要 为 所 有 的 方向 变量 ( 即 
结构 体 中 的 成 员 di Hé — 4 Ec FEE? 
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一 个 比较 好 的 方案 是 在 每 一 个 结构 体 中 建 一 个 互 斥 量 。 当 控制 动画 的 线程 和 用 户 输入 
线程 读 取 或 修改 结构 体 中 共享 变量 的 时 候 ,这 个 下 斥 量 开 始 工作 。 修 改 后 的 结 梅 址 定义 
如 下 : 


struct propset{ 


char * Str; /* the message */ 
int row: /* the row x/ 
int delay; /* delay in time units x/ 
int dir; /* *lor-1»/ 
pthread mutex t iock; /* a mutex for dirs / 
} 
setup 中 的 初始 化 程序 如 下 : 
for (i=0; i-num msg; i++}14 
props[i].str = strings| il; /* the message «/ 
props i].row = i; /* the row #/ 
props[ i]. delay = 1+ (rand() %15); /* a speed x/ 


props[i].dir = ((rand() %2)? 1,- 15; /* #1lor -1«/ 
pthread_mutex_init(&props( i]. lock, NULL); 
} 


程序 中 其 他 的 改进 留 给 大 家 必 为 练习 。 

2， 屏 幕 冲突 :临界 区 

方向 变量 并 不 是 惟一 的 共 训 资源 。 修 改 屏幕 和 光标 位置 的 各 晴 数 同样 也 被 所 有 动画 线 
RAS. TARR mx 来 防止 对 这 些 聊 数 的 同步 访问 冲突 。 

看 一 下 animate 中 的 屏幕 控制 调用 ;move、addch addstr 和 refresh。 如 果 两 个 线程 并 发 
地 按照 这 个 顺序 执行 指令 ,那么 结果 会 怎样 ? 举例 来 说 ,如 果 两 个 线程 交替 地 调用 :move、 
move.,addch .addch addstr、addstr… ,会 导致 什么 样 的 结果 ? 

第 一 个 线程 使 用 move 将 光标 置 于 某 个 屏幕 位 置 RABI TREX SRK LL B b 
方 去 。 然 而 这 时 第 一 个 线程 以 为 光标 述 在 康 处 ,就 将 一 些 文字 和 输出 到 这 个 位 置 , 结 果 显 然 是 
错误 的 1 

由 于 设置 光标 的 库 函 数 不 会 意识 到 线程 的 存在 ,所 以 对 某 个 特定 函数 的 访问 并 不 会 因 
为 多 线 程 的 存在 而 受 干扰 。 但 为 了 保证 某 一 时 刻 只 有 一 个 线程 可 以 访问 设置 光标 的 函数 ， 
这 里 同样 使 用 了 互 斥 量 机 制 。 

光标 控制 函数 库 包 含 了 许多 内 部 的 结构 体 。 就 像 用 互 斥 量 来 保护 白 定 义 数 据 结构 一 
FE ,这 里 也 使 用 互 斥 量 来 防止 对 系统 系统 库 内 部 的 数据 结构 的 访问 冲突 。 


14.7.5 屏幕 控制 线程 


使 用 互 斥 量 并 不 是 防止 屏幕 控制 冲突 的 惟一 方法 。 另 一 个 方法 就 是 创建 一 个 新 的 线程 
来 处 理 所 有 对 屏幕 控制 函数 的 调用 ,如 图 14.13 BER, 
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这 个 移动 的 图 片 由 一 个 独立 的 线程 控制 :这些 
附 党 很 多 线 的 进 种 线程 将 对 屏幕 画面 的 更 新 请 求 放 人 信箱 中 

paar 一 个 线程 授 收 
到 对 屏幕 的 更 
新 清 求 ， 然 后 
调用 屏幕 处 理 
函数 





一 个 线程 读 取 并 
处 再 用 户 输 入 Es 


图 14.13 ”和 独立 处 理 屏幕 控制 的 线程 


可 以 把 这 个 屏幕 榨 制 线程 看 成 在 一 个 大 公司 中 的 公共 关系 部 门 。 任 何 想 要 向 媒体 发 送 
消息 的 部 门 都 必须 向 公共 关系 部 门 发 送 请 求 。 公 共 关 系 部 门 里 的 员工 只 关心 如 和 何 将 消息 发 
送出 去 。 

其 实 这 个 屏幕 控制 线程 在 功能 上 就 像 这 个 公关 部 一 样 ,任何 希 望 向 屏 暮 发 消息 的 线程 
都 必须 向 这 个 屏幕 管理 线程 发 送 请 求 。 

采用 这 种 机 制 之 后 ,每 个 线程 所 发 送 的 请 求 就 应 该 包含 这 些 信息 : 行 号 、 列 号 和 消息 字 
符 串 。 控 制 动 画 的 线程 发 出 消息 ,屏幕 管理 线程 接 到 消息 后 ,将 其 显示 在 屏幕 上 

这 种 生产 者 (发 消息 线程 ) 一 一 消费 者 (接收 消息 线程 ) 的 设计 类 似 于 前 面 学 习 的 多 线程 
版 的 字数 统计 程序 : 稀 要 一 个 存储 变量 来 放置 消息 ,通过 互 斥 量 来 性 免 对 此 存储 变量 的 访问 
冲 府 , 以 及 一 个 条 件 变量 ,在 动画 线 穆 发 送 消息 之 后 ,可 以 通过 这 个 条 件 变量 将 屏幕 侯 制 线 
程 唤醒 

对 于 屏幕 控制 功能 的 集中 化 和 抽象 化 设计 使 得 程序 更 加 灵活 。 就 算 饶 幕 显示 系统 更 殴 
了 ,也 只 需 改 变异 幕 控 制 线程 中 使 用 的 函数 。 屏 蔗 控 制 线程 甚至 还 可 以 发 起 同 远 端 显示 服 
务 器 的 一 个 会 话 , 通 过 管道 或 套 接 字 将 消息 发 过去 ,然而 这 一 切 对 于 控制 动画 的 线程 来 说 都 
是 透明 的 。 改 进 这 个 程序 就 留 给 大 家 作为 练习 完成 。 


小 8 


lL 主要 内 容 

执行 线路 即 为 程序 的 控制 流程 。pthreads 的 线程 库 允 许 程序 在 同一 时 刻 运行 多 个 

e RK » 

* 同时 执行 的 各 函数 都 拥有 自己 的 局 部 变量 ,但 共 环 所 有 的 全 局 变量 和 动态 分 配 的 数 
据 空 间 。 

- 当 线程 共享 变 昌 时 ,必须 保证 它们 不 会 发 生 共 享 冲 突 。 线 程 使 用 互 斥 锁 来 保证 在 某 

一 时 刻 只 有 一 个 线程 在 对 共享 变量 访问 。 

线程 间 通 过 条 件 变 沉 来 互相 通知 和 同步 数据 。 一 个 线程 排 起 并 等 待 着 条 件 变量 按照 

其 种 特定 方式 变化 ,而 另 一 个 线程 则 发 信号 使 得 条 件 变 黄 发 生变 化 。 

AUS Be Ae OR TI RE a hE, AEE A Ky eR ICA 


* 
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按照 这 种 方式 进行 保护 。 
2. 下 一 步 做 什么 
一 个 程序 可 以 包括 苦 干 进 程 ,进程 之 间 通 过 管道 .文件 ,socket 和 信号 进行 通信 。 程 序 也 
可 以 包含 多 个 线程 ,它们 之 间 通 过 共享 变量 、 文 件 、 锁 以 及 信和 号 进行 通信 。 前 一 章 主要 学 习 
了 进程 间 的 通信 。 那 么 Unix 中 提供 了 多 少 种 通信 方式 呢 ? 如 何 为 你 的 应 用 程序 选择 最 合 
适 的 通信 方法 呢 ? 下 .一 章 将 给 出 这 些 问题 的 答案 ， 
3. 习题 


14.1 


14.3 


线程 基本 操作 的 练习 。 对 hello multi. c Bin T BR: 

首先 ,多 加 几 条 消息 色 程 序 中 ,接着 为 新 加 的 消息 创建 线程 。 

然后 修改 print, msg 函数 中 的 循环 次 数 ,使 其 与 所 要 打印 的 字符 串 的 长 度 一 致 。 
在 每 一 条 pthread join 语句 之 后 打印 信息 ,以 观察 程序 的 执行 情况 ,并 解释 结果 。 


对 tanimate 使 用 管道 命令 ,tanimate 就 可 以 从 标准 输入 中 读 取 它 的 字符 由 列表 。 


”那么 如 下 的 命令 : 


who| tanimate 


就 可 以 起 作用 了 。 将 这 一 功能 添加 进去 并 不 是 一 件 小 事 。 需 要 首先 从 标准 输入 
读 取 字符 行 , 然 后 将 标准 输入 重 定向 到 终端 ,这 样 屏幕 控制 线程 就 可 以 非 标准 的 
模式 读 取 字 符 了 (打开 /dev/tty 并 将 它 复 制 到 标准 输入 )。 


在 视频 游戏 懂 一 章 中 ,大 家 一 定 注意 到 在 代码 的 临界 区 使 用 信号 标记 来 防止 访 
问 冲 突 。 将 信号 标记 和 信和 号 处 理 机 制 与 线程 . 互 斥 锁 以 及 条 件 变量 机 制 做 一 个 
比较 。 


4. 编程 练习 


14.4 


14.6 


14.7 


f£ hello multi. c 中 , fa d £X RR GL SE TAAR. S-~TROERAR. ALITA 
“hello” B9 ££ fg Pj it — 4 35 B5 A LOK TT A “world\n”, BE— A £X 2 25$ £r TT ED 
“world\n” 的 线程 返回 ? AHA? 


twordcountl. c 用 了 三 个 线程 :初始 线程 和 两 个 计数 线程 ,但 初始 线程 完成 很 少 
的 功能 。 写 一 个 新 程序 ,让 原 线程 统计 第 一 个 文件 的 字数 ,然后 再 创建 一 个 线程 
统计 第 二 个 文件 的 字数 。 这 种 方法 是 否 执 行 得 快 一 点 ? 哪 一 种 设计 更 好 ? 


count words 细 数 报错 说 无 法 打开 指定 的 文件 。 鼠 管 这 样 另 一 个 线程 仍然 继续 
和 运行。 这样 好 吗 ? 修改 程序 使 count, words REF) AA XAT EU FI. exit 


如 何 扩展 twordcount2. c 和 twordeount3.c 中 的 方法 ,让 程序 可 以 在 命令 行 上 接 
收 多 个 文件 ? 修改 这 两 个 程序 使 它们 可 以 在 命令 行 上 接收 任意 数目 的 文件 和 名。 
哪 一 个 版 本 的 程序 容易 扩展 ?” 哪 一 个 更 高 效 呢 ? 


14. 


14. 


14. 


14. 


14. 


14. 
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Unix/Linux ffe Be PERS 

进程 与 线程 ， 

(1) 写 一 个 新 版 本 的 字数 统计 程序 ,用 fork 为 每 个 文件 创建 新 的 进程 。 需 要 为 
子 进程 设计 一 个 系统 ,使 它们 在 以 将 结果 传 回 给 父 进 程 使 用 。 不 要 使 用 进程 
退出 值 来 返回 这 个 结果 ,因为 这 个 值 不 能 超出 255。 使 用 fork 的 一 个 好 处 就 
是 可 以 使 用 标准 的 we 一 w 命令 来 统计 每 个 文件 中 的 字符 数 。 

(2) 写 一 个 单线 程 的 字数 统计 程序 。 

(3) 将 这 三 个 版 本 的 程序 (进程 .多 线程 和 单线 程 ) 做 一 下 比较 , 哪 一 个 容易 设计 、 
容易 编码 ? 哪 :一 个 执行 效率 高 ? 哪 一 个 可 移植 性 好 ? 

扩展 twordcount4. c 程序 ,使 其 在 命令 行 上 可 以 接收 多 于 两 个 文件 名 。 

将 twordcount4.c 中 的 全 局 变量 作为 main 函数 的 局 部 变量 ,然后 将 指向 它们 的 
指针 作为 结构 体 的 成 员 。 再 将 结构 二 地 址 传 给 线程 。 

YE twebserv. c 中 加 入 互 斥 锁 来 保护 对 统计 变量 的 访问 。 

删除 tbounceld. c 中 的 所 有 件 局 变量 。 定 义 -- 个 结构 体 来 包含 所 有 跳动 文字 的 
HE. . 

thounceld.c 程序 中 的 共享 状态 需要 五 斥 锁 机 制 。 如 果 不 如 锁 , 会 导致 什么 样 
的 结果 ? 两 个 线程 冲突 会 造成 什么 样 的 结果 ? 

单字 符 串 的 动画 程序 包含 了 对 速度 的 控制 。 用 户 可 以 通信 按键 “s” 和 “f” 来 增 坟 
和 和 降低 动作 间 的 延 时 ,将 速度 控制 加 入 杀生 符 串 动 关 程 序 中 。 

tanimate, c 中 所 有 的 消息 都 是 水 平移 动 的 。 修 改 程序 使 得 一 些 字符 串 上 下 移 
动 ,而 另 一 些 水 平移 动 。 如 和 何 来 榨 制 冲突 ? 

修改 tanimate 程序 ,使 用 -- 个 单独 的 线程 进行 屏幕 管理 。 控 制 动 画 的 线程 必须 
先 将 消息 发 送 给 屏幕 管理 线程 ,由 昼 幕 管理 线程 对 消息 进行 显示 。 

MT finger 服务 器 需要 一 个 多 线程 的 服务 器 来 提供 服务 。 服 务 髓 每 次 接收 一 行 
输 人 。 然 后 服务 器 在 数据 库 中 查询 这 个 字符 单 ,再 将 匹配 这 个 字符 串 的 记录 返 
回 给 客户 端 。 服 务 器 运行 包 售 如 下 步骤 : 

(1) 将 用 户 数据 库 载 信人 内存: 

(2) 为 每 一 个 请 求 创建 一 个 独立 线程 (detached thread); 

(3) IRS Bic RS PH AA RHR: 

(D 对 于 STATUS 的 特殊 请 求 ,服务 器 将 返回 统计 数据 ; 

(5) 在 接收 到 SIGHUP 消息 之 后 ,服务 器 刷新 其 内 部 数据 库 。 

在 tanimate 那 一 节 的 结尾 , 曾 讨 论 了 如 何 将 录 示 功能 与 计时 和 数据 处 理 逻 辑 分 


开 ， 写 一 个 客户 /服务 器 版 本 的 tanimate 程序 ,用 数据 报 的 socket 将 简单 的 请 
求 信 息 从 tanimate 程序 发 送 到 显示 服务 器 上 。 
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显示 服务 器 支持 包 会 如 下 两 条 命令 的 简单 协议 : 

CLERR clears the display 

DRAW RC Any string puts "Any string" at row R,column C 

修改 后 的 版 本 不 青 需要 调用 屏幕 控制 函数 。 它 只 需 向 显示 服务 器 发 送 消息 。 
显示 服务 器 接收 这 些 信息 ,然后 把 消息 中 包含 的 字符 串 显示 出 来 。 在 做 这 道 题 
听 的 时 候 , 可 以 去 研究 Unix 使 用 的 X11 window 系统 的 没 计 思想 。 
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概念 与 技巧 

， 挂 起 并 等 候 从 多 个 源 端 的 输入 : select 和 poll 
。 命名 管道 

， EWE 

* 文件 锁 

: 信和 号 量 

* IPC(InterProcess Communication) MW 
相关 的 系统 调用 与 函数 

* select,poll 

+ mkfifo 

* shmget,shmat,shmcti .shmdt 

* semget,semcti,semop 

相关 命令 

。 talk 

* lpr 


15.1. 编程 方式 的 选择 


很 六 以 前 , 当 两 人 试图 互相 交流 的 时 候 , 可 选择 的 方式 非常 的 少 ; 交谈 或 者 投掷 石 块 。 
当代 人 们 的 选择 多 了 很 多 : 蜂窝 电话 .电子 邮件 .信件 .特快 专递 .自行 车 投递 .网 络 电话 、 纸 
张 . 显 示 器 上 贴 的 备忘录 等 ,当然 也 可 以 直接 交谈 或 投 搓 石 块 。 每 种 方法 都 有 其 优点 和 缺 
点 。 那 么 人 们 如 何 选 择 其 交流 方式 呢 ? 

作为 一 名 Unix 程序 员 ,必须 学 会 如 何 选择 进程 间 通 信 的 方法 。 每 一 种 方式 都 有 其 优 缺 
点 ;如 何 进行 选择 呢 ? 

本 章 从 学 习 talk 开始 。 人 们 使 用 talk 来 互相 发 送 消息 ,并 将 会 比较 讨论 各 种 Unix Jj 
法 ,看 看 它们 是 如 何在 进程 癌 传 递 消息 的 。 
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15.2 talk 命令 : 从 多 个 数据 源 读 取 数 据 


Unix 的 talk 命令 是 一 种 通信 工具 。talk 允许 大 们 在 终端 间 传 送信 息 talk 甚至 可 以 路 
fi Internet 来 连接 不 司机 器 的 终端 .如 加 15.1 所 示 。 


hosti hosi? 
= fF 





| 对 话 进程 









对 话 进程 





whee TPs 


oc 


图 ]5.1 talk YEfERUZE E G8 E E d 


使 用 talk 命令 的 时 候 , 屏 幕 被 分 为 上 下 两 个 部 分 ,用 户 以 字符 终端 模式 来 操作 。 输 入 字 
符 的 时 候 , 字 符 会 同时 显示 在 两 个 窗口 中 。 你 所 输入 的 字符 会 出 现在 上 面 的 窗口 中 ,而 对 方 
输入 的 字 出 现在 下 面 的 窗口 中 。calk 使 用 socket 进行 通信 ,如 图 15. 2 所 示 。 





到 1$.2 (talk 命令 的 工作 方式 


talk 命令 读 取 字符 并 将 它们 写 到 目的 地 ,但 与 所 学 过 的 其 他 程序 不 同 ,taik 同时 等 待 从 
两 个 文件 描述 符 的 输入 ， 


15.2.1 同时 从 两 个 文件 描述 符 读 取 数 据 


talk 从 键盘 和 socket 接收 数据 。 从 键盘 输 人 读 取 的 字符 被 复制 到 屏幕 中 上 半 个 窗口 ， 
并 通过 socket 发 送出 去 。 同 样 从 socket 恋人 的 字符 被 添加 到 屏幕 下 面 的 窗口 中 。 

talk 的 用 户 可 以 以 任意 速度 和 任意 顺序 给 人 字符 。ralk 程序 就 必须 在 任何 时 刻 都 准备 
好 从 任 一 数据 源 接收 字符 ,而 不 像 其 他 的 程序 可 以 依靠 明确 的 协议 。 服 务 器 等 待 着 read 或 
recvfrom 的 请 求 , 并 用 write 或 sendro 发 回 一 个 应 答 。 用 户 不 可 能 一 直人 在 切换 自己 的 角色 
(输入 完 之 后 等 待 别人 的 应 答 , 然 后 再 输入 ……) ,那么 talk 程序 如 何 解决 这 个 问题 呢 ? talk 
当然 也 不 能 这 样 做 ,如 下 述 代 码 : 


whilecl)( 
read(fd kbd,&c,1); /* read from keyboard «/ 
waddch( topwin,c) ; /* add to screen «/ 
write(fd sock,&c,1); /« send to other person »/ 
read(fd sock,&c,!); /* read from other person »/ 
waddch(botwin,c); /* add to screen «/ 
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按照 上 述 代码 的 逻辑 ,如 果 对 方 一 直 在 输入 信息 ;而 你 却 一 直 在 看 他 发 的 消息 ,自己 没 
有 输入 过 , 那 结 果 会 怎么 样 呢 ? 程序 在 第 一 个 read 调用 的 时 候 就 挂 起 了 ,并 不 会 从 你 的 对 方 
那里 读 取 数据 。 上 面 的 方法 只 有 在 用 户 趟 断 切 换 自 己 角 色 的 时 候 才 可 以 正常 工作 。 

这 里 通过 调用 feni 函数 将 文件 描述 符 设 置 为 OQ_NONBLOCK 标志 从 而 使 文件 描述 符 
变 成 非 阻塞 模式 。 使 用 上 阻塞 模式 使 得 对 于 read 的 调用 立即 返回 。 这 个 时 个 ,如果 并 淮 有 
宁 符 可 以 读 取 ,read 调用 返回 零 。 虽 然 非 阻塞 的 方式 可 以 工作 ,从 是 它 占 用 了 太 多 的 处 理 器 
时 间 。 由 于 每 次 调用 read 都 是 一 个 系统 调用 ,程序 就 必须 回 到 内 核 模式 工作 .这样 在 等 竺 
一 个 字符 到 来 之 前 系统 可 能 会 切换 上 于 次 。 


15.2.2 select 系统 调用 


Unix 系统 提供 了 系统 调用 select, 它 允许 程序 挂 起 ,并 等 待 从 不 止 一 个 文件 措 述 符 的 输 
和 人 。 它 的 原理 很 简单 : 

OD 获得 所 需要 的 文件 描述 符 列 表 ; 

C2) 将 此 列表 传 给 select; 

(3) select 挂 起 直到 任何 一 个 文件 描述 符 有 数据 到 达 ; 

(4) select 设置 一 个 变量 中 的 若干 位 ,用 来 通知 你 娜 一 个 文件 描述 符 己 经 有 输入 的 数据 。 

下 面 的 程序 selectdemo. c 等 待 两 个 设备 土 数据 到 达 : 


/* selectdeme.c ; watch for input an Lwo devices ANP timeout 


x usage: selectdemo devl dev2 timeout 

x action; reports on input from each file, and 
* reports timeouts 

x/ 


X include  «stdio, hz 

# include  «—sys/time.h 人 
# include <isys/types. h> 
# include  —umistd. h> 
Hinclude <(fentl. h> 


# define oops(m,x) | perror(m); exittx); | 


main(int ac, char * av[ D 


1 


int fdl, fd2; /* the fds to watch «/ 
struct timeval timeout; /* how long to wait #/ 

fd set readfds; /* watch these for input */ 
int maxfd; /* max fd plus 1 +/ 

int retval; /* return from select «/ 


if(Cao l5 4 5j 


fprintf(stderr, "usage; & s file file timeout", * av); 
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} 


exit(1); 

E 

/** open files « «/ 

if ( (fdl = open(av[1],O RDONLY)) == -1) 
oops(av[1], 2); 

if C (fd2 = open(avs[2],0 RDONLY)) == -1) 


oops(av[ 27, 3); 
maxfd = 1 + (fdi-c-fd29 fdl,fd2); 


while(1) { 


/»* make a list of file descriptors to watch x æ’ 


FD_ZERO( &readfds) ; 
ED SET(fdl, &readfds) ; 
FD SET(fd2, &readfds) ; 


/** set timeout value x x/ 


/* clear all bits #/ 
/* set bit for fdi »/ 
/* set bit for fd2 «/ 


timeout.tv sec = atoi(av[3p; /* set seconds «/ 


timeout. tv usec = 0; 


/** wait for input » x/ 


/* no useconds x, 


retval = select(maxfd,&readfds, NULI,, NULL, &timeout); 


if( retval == -1) 
oops( "select",4); 
if ( retval > 0 2l 
/* * check bits for each fd x «/ 
if ( FD ISSET(fdl, &readfds) } 
showdata(av[1], fd1); 
if ( FD ISSET(fd2, &readtds) ) 
showdata(avi 2], fd2); 
} 
else 


printf("no input after & d seconds\n"” 


r 


showdata(char * fname, int fd) 


{ 


char buf[BUFSIZ|; 


int n; 


printf("$€ s, ", fname, n); 
fflush(stdout); 
n = read(fd, buf, BUFSIZ); 
if (n == -12 


atoi(av[3])); 


* 467 


+ 468 * Unix/Linux 编程 实战 教程 





oopsffname , 5) : 
write(1, buf, n); 
write(1, "An", 1); 
} 


EAS RS 8 T Bl ri PLA Oe, CT RE A i A AE fd. sel 
类 型 的 变量 中 。 宏 FD_ZERO、FD_SET #1 FD ISSET 先 将 fd_set 中 所 有 位 清除 ,然后 为 某 
文件 描述 符 设 置 一 位 ,再 对 该 位 进行 监听 。 和 希望 同时 对 两 个 文件 描述 符 监 听 ,因此 调用 了 两 
tk FD SET, 

select 调用 同时 也 接受 对 于 超时 的 处 理 。 如 果 在 指定 的 时 间 内 ,没有 数据 到 达 ,select 将 
直接 返回 。 在 selectdemo.c 中 ,在 命令 行 接收 一 个 字符 串 必 为 超时 的 时 间 值 。 用 下 而 的 代 
码 对 程序 进行 测试 ， 


5 cc selectdemo.c - o selectdeno 

5 ./selectdemo /dev/tty /dev/mouse 10 
hello 

/dev/tty; hello 


no input after 4 seconds 
no input after 4 seconds 
LesLing 

/dev/tty, testing 

JR ERIT RE 
/dev/mouse, ( 
/dev/mouse, 


/dev/mouse; y 


TATER TEP MSR ROMAN EK. SRAKA DA VETE SAB 
的 程序 ,不 只 是 将 输入 打印 出 来 ,并 且 对 输入 进行 特定 的 处 理 。 

















select 调用 小 结 如 下 。 
select 
目标 同步 的 1/0 复 用 
wet # include <isys/time, h>> 
A K Jt int = select Cint numfds, 


id set * read set, 

Íd set » write set. 

fd sei * error. set, 

struct limeval * timeouL) ; 
void FD ZERO(Íd set * fdset) 
void FD. SET(Cint fd, fd, set * fdsct? 
void FD CLR(inti fd, fd set * fdset) 
void FD ISSET(int fd. fd set. s fdset) 


一 
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SR 





select 


参数 numfds $88 SOT BS ae A d fah 1 
read set 等 待 从 此 集合 包括 的 文件 描述 符 到 来 的 数据 
write_set 等 待 向 这 些 文件 描述 符 写 数 据 的 许可 
error_set 等 待 这 些 文件 描述 符 操 作 的 异常 
timeout 超过 此 时 间 后 函数 返回 











Baw n 一 1 发 生 错 误 
0 超时 
num 满足 需求 的 文件 描述 符 的 数 晶 


select 同时 监视 多 个 文件 描述 符 。 在 指定 情况 发 生 的 时 候 , 函数 返回 。 详 细 一 点 说 ， 
select 监听 在 三 组 文件 描述 符 上 发 生 的 事件 , 检查 第 一 组 是 否 可 以 读 取 ,检查 第 二 组 是 否 可 
以 写 人 ,检查 第 三 组 是 否 有 异常 发 生 。 每 一 组 的 文件 描述 符 被 记录 到 一 个 二 进 制 位 的 数组 
中 。 这 里 的 numfds 恰好 等 于 需要 监听 的 最 大 的 文件 描述 符 加 1。 

当 参 数 指 定 的 条 件 被 满足 或 超时 的 时 候 ,select 画 数 返 回 。 若 指定 的 条 件 被 满足 ,seleet 
返回 满足 条 件 的 文件 描述 符 的 数目 。 

车 任 一 参数 为 nul, select 将 忽略 此 参数 。 


15.2.3 select 与 talk 


本 章 并 不 打算 把 talk 的 程序 写 出 米 , 因 为 关于 定位 其 他 的 用 户 和 建立 连接 还 有 很 多 步 
又 要 做 ,比如 说 : 定位 对 方 用 户 就 需要 搜寻 tmp X. 大 家 已 经 学 习 过 实现 其 他 所 有 步 又 
所 需 的 知识 和 技巧 了 。 其 他 还 有 哪些 步骤 呢 ? 它们 需要 哪些 勾 统 调用 ? 这 两 个 问题 就 留 给 
大 家 回答 了 。 


15.2.4 select 5 poll 


也 可 以 合用 poll 调用 来 代替 select 的 功能 。select 是 由 Berkeley 研制 出 来 的 ,而 boll W 
是 风 尔 实验 室 的 成 果 。 这 两 者 完成 类 似 的 功能 ,而 现代 的 大 部 分 的 Unix 版 本 对 于 两 者 部 
支持 。 


15.3 通信 的 选择 


talk 命令 是 Unix 系统 程序 的 一 个 很 好 的 例子 , 它 很 好 最 体 现 了 进程 何如 何 进行 通信 和 
分 工 合 作 。talk 中 的 两 个 进程 读 写 消 息 , 就 好 像 消息 是 被 存储 在 常规 的 磁盘 上 一 样 。 

talk 中 的 文件 描述 符 分 别 对 应 了 键盘 、 屏 幕 和 socket( 如 图 15.3 所 示 ) ,但 它们 仍然 可 以 
被 连接 到 其 他 进程 或 其 他 设备 上 去 。talk 程序 中 的 进程 间 数 据 传输 与 进程 间 的 操作 都 是 极 
为 重要 的 部 分 。 要 知道 选择 一 个 好 的 通信 方式 和 选择 正确 的 算法 或 数据 结构 一 样 的 重 鉴 。 


。470 3 Unix/Linux 编程 实 贱 教程 








SAHEN. E 


Vt AXE ETE 


8115.3. 三 个 文件 描述 答 


15.3.1 一 个 问题 的 三 种 解决 方案 


问题 : 从 服务 器 得 到 数据 ,将 其 传 给 客户 端 ,如何 来 决定 选择 哪 一 种 道 信 方法 呢 ? 想 一 
想 前 面 使 用 流 socket 写 过 的 时 间 / 日 期 服务 器 。 荣 一 进程 知道 当前 的 时 间 , 而 另 一 进程 想 获 
取 时 间 信 息 ( 如 图 15. 4 所 示 ) ,如 何 让 一 个 进程 从 另 一 个 进程 得 到 数据 呢 ? 


EP ia 服务 器 





图 15.4 某 进 程 拥有 另 一 进 改 所 要 获得 的 信息 





三 种 解决 方案 ; 文件 .管道 ,共享 内 存 。 图 15.5 展示 了 三 种 不 同 的 方法 : 一 种 是 已 经 学 习 
过 的 ,但 另外 的 两 种 方法 却 是 新 的 。 大 家 所 熟悉 的 方案 是 使 用 文件 ,而 另外 的 两 种 新 方案 是 命 
名 管道 (named pipe) & JE3X WY TF Bt (share memory segment) 策 略 。 这 些 方法 分 别 通 过 磁盘 、 内 核 
及 及 用 户 空间 进行 数据 的 传输 。 那 么 每 种 方法 具体 如 何 应 用 ? 各 有 何 优 缺 点 昵 ? 







Eu 两 个 进程 拥有 有 指 
: 向 同一 个 共享 内 
存 段 的 指针 


kem | 。 通过 读 写 同一 个 
从 管道 传递 数据 d Os 文件 来 共享 数据 
图 15.5 三 种 传输 数据 的 方法 


15.3,2 通过 文件 的 进程 间 通 信 


进程 则 可 以 通过 文件 来 进行 通信 。 某 进程 将 数据 写 和 人 文件 , 别 的 进程 再 将 数据 从 文件 
中 读 出 。 

OD 使 用 文件 进行 通信 的 时 间 / 日 期 服务 器 

这 里 不 必 写 一 个 完整 的 C 程序 ,下 面 的 一 个 shell 脚本 就 可 以 完成 任务 了 。 

BI /bin/sh 


H time server — File version 





Se iega 
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while true ; do 
date 7» /ztemp/current date 
sleep } 


done 


HSER 1 秒 钟 将 当前 的 时 间 和 日 期 写 人 文件 中 。 和 输出 重 定向 符 *>” 每 次 将 该 文 
件 内 雁 删除 然后 更 写 。 

(2) 使 用 文件 进行 通信 的 时 间 / 日 期 客户 器 

客户 端 读 取 文件 的 内 容 : 


#1 /bin/sh 
H tineclient - file version 


cat /Enp/current date 


(3) 使 用 文件 的 IPC 小 结 

访问 控制 : 客户 端 必 须 能 够 诱 了 文件 。 遂 过 使 用 标准 文件 访问 权限 ,可 以 给 予 服务 器 写 
权限 并 且 限 制 客户 端 只 有 读 瓜 限 。 

Se Pit: 任意 数 朋 的 客户 可 以 同时 从 文件 中 读 取 数据 。Unix 并 不 限制 同时 打开 同一 
文件 的 进程 数目 。 

竞 态 条 件 : 服务 器 通过 清空 内 容 再 重 写 的 方法 米 更 新 文件 。 如 果 某 客户 恰好 在 详 空 和 
重 写 之 向 谈 取 文件 ,那么 蕊 得 到 的 将 是 一 个 空 的 或 只 有 部 分 的 内 容 。 

BREA: 服务 器 和 客户 端 可 以 使 用 某 种 类 型 的 互 斥 量 来 避免 竟 态 条 件 。 后 面 的 
章节 中 大 家 将 会 学 到 文件 锁 的 方法 。 另外, 如果 服 务 器 在 程序 中 使 用 lseek 和 write 函数 来 
替换 create, 这样 文件 永远 都 不 可 能 为 空 ,因为 write 有 是 一 个 原子 操作 . 它 不 会 在 执行 中 被 
ne. 


15.3.3 命名 管道 


通常 的 管道 只 能 连接 相关 的 进程 。 常 规 管道 由 进程 创建 .并 由 最 后 一 个 进程 关闭 。 

使 用 命名 管道 可 以 血 接 不 相关 的 进程 ,并 且 可 以 独立 于 进程 存在 (如 图 15. 6 所 未 )。 称 
这 样 的 命名 管道 为 FIFO( 先 进 先 出 队列 ) FIFO 炎 似 于 放 在 草坪 十 的 一 自给 花园 灌水 的 水 
管 。 和 任何 人 都 可 以 将 此 水 管 的 一 端 放 在 自己 的 耳 傈 边 ,而 另 一 个 人 通过 水 管 向 对 方 说 话 ， 
人 们 可 以 通过 此 水 管 进行 交流 , 而 在 没有 人 使 用 的 时 候 ,水 管 仍 然 是 存在 的 。FIFO 可 以 看 
作 由 文件 名 标志 的 一 根 水 管 。 








& 15.6 FIFO 与 进程 独立 
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1, 使 用 FIFO 

(1) 如何 创建 FIFO? 

HERE mkfifo(char * name, mode t maode) 使 用 指定 的 权限 模式 来 创建 FIFO. mkfifo 
der ECC Ua Fx T ERR 

(2) 如 何 删 除 FIFO? 

类 似 于 删除 交 件 ,unlink(fifioname) 函 数 可 以 用 来 删除 FIFO, 

(3) 如 何 监听 FIFO 的 连接 ? 

fi open (filoname, O RDONLY) B&H. open 甫 数 阳 塞 进程 直到 某 一 进程 打开 FIFO 
进行 写 操作 。 

(4) 如 何 通 过 FIFO 开始 会 话 ? 

使 用 open(fifoname,O_WRONLY) BR. shay open 函数 阻塞 进程 直到 某 一 进程 打开 
FIFO 进行 读 取 操作 。 

《5)》 商 进程 如 何 通过 FFO 进行 通信 ? 

发 送 进程 用 write 调用 ,而 监听 进程 使 用 read 调用 。 写 进程 调用 close 来 通知 读 进 程 通 
信 结 束 。 

FA shel 脚本 是 基于 FIFO 的 时 间 / 日 期 服务 的 服务 器 和 客户 端 程序 ， 


41 /bin/sh 
+ time server 
while true ; do 
rm —f /tmp/time fifo 
mkfifo /tmp/time fifo 
date => /tmp/time fifo 
done 
41 /bin/sh 
# time client 
cat /tmp/time fifo 


2. FIFO 类 型 的 IPC 小 站 

ibl: FIFO 使 用 与 通常 文件 相同 的 文件 访问 。 服 务 器 有 写 权 限 , 而 客户 端 只 限于 读 
B. 

多 个 客户 端 : 命名 管道 是 一 个 队列 而 不 是 常规 文件 。 写 者 将 字 节 写 人 队列 ,而 读者 从 队 
列 头 部 移出 字 节 。 每 个 客户 端 都 会 将 时 间 / 吕 期 的 数据 移 岂 队列 ,因此 服 竹器 必须 重 写 数据 ， 

竞 态 条 件 ; FIFO 版 本 的 时 间 / 日 期 服务 器 程序 完全 不 存在 竞 态 条 件 问 题 。 在 信息 的 长 
度 不 超过 管道 的 容量 的 情况 下 ,read 和 write 系统 调用 只 是 原子 操作 。 读 取 操 作 将 管道 清空 
而 写 入 操作 叉 将 管道 塞 满 。 在 读者 和 写 者 连通 之 前 ,系统 内 核 将 进程 挂 起 。 因 此 锁 机 制 在 
这 里 并 不 需要 。 

时 间 ” 日 期 服务 器 将 数据 写 人 FTEGO 后 ,将 自己 挂 起 直到 客户 端 打开 FIFO 来 读 取 数 据 。 
在 某 些 应 用 程序 中 ,服务 器 从 FIFO 中 读 取 数据 ,然后 等 待 客户 端 把 数据 写 人 。 大 家 想 想 看 
有 没有 服务 器 等 待 客户 端 输 入 的 例子 ? 
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15.3.4  3tx D 


字 节 流 是 如 何 通过 文件 或 FIFO 来 传输 的 ? write 将 数据 从 内 存 复制 到 内 核 缓存 中 。 
read 将 数据 从 内 核 缓存 复制 到 内 存 中 。 

如 果 进 程 运行 在 用 户 室 间 的 不 同 部 分 ,进程 间 是 如 何 将 数据 从 内 核 缓存 中 复制 进 复制 
出 的 呢 ? 同一 个 系统 里 的 两 个 进程 通过 使 用 共享 的 内 存 段 来 交换 数据 ， 共 享 的 内 存 段 是 用 
户 内 存 的 一 部 分 。 每 一 个 进程 都 有 一 个 指向 此 内 存 段 的 指针 (如 图 15. 7 所 示 )。 依 靠 访问 权 
限 的 设置 ,所 有 进程 部 可 以 读 取 这 一 鼎 空 间 中 的 数据 。 因 此 进 各 问 的 痪 饭 是 共享 的 ,而 不 是 
玻 复 制 来 复制 去 的 。 共 享 内 存 段 对 于 进程 而 言 , 就 类 似 于 共享 变量 对 于 线程 一 样 


HAA Fs] LA 
LE FURS 
直接 和 数据 放 
AB THE 
的 内 存 空间 中 





使 用 管道 器 要 两 
次 复制 数据 


图 15. 7 两 个 进香 具 享 一 块 内 存 区 域 


). 共享 内 存 段 的 一 些 焉 本 概念 
”共享 内 存 中 在 内 存 中 不 依 贺 于 进程 的 存在 而 存在 。 
共享 内 存 段 有 自己 的 名 字 , 称 为 关键 字 (key) 。 

”关键 字 是 一 个 整 型 数 。 

共享 内 存 自 有 上 自己 的 拥有 者 以 及 权限 位 。 

”进程 可 以 连接 到 某 共 享 内 存 段 3E ALR $8 8 e ae BB £F 

2. RHR AAI 

(D 如 何 得 到 共 室 内 存 段 7 

int seg Jd = shmget(key. size—of-segment, flags) 

如 果 内 存 段 存 在 ,函数 shmget 找到 它 的 位 置 。 如 果木 存在 ,可 以 通过 在 flags 值 中 指定 
一 个 创建 此 段 和 初始 化 权 当 模式 的 请 求 。 

(2) ünfspg SURE pe BE SLE I TER P3 E ERO 

void ptr = * shmat(seg id NULL flags) 

shmat €E lE fe [19 l.l. «5 [8] P Ol BEL A E Et SEA 3E3R — 38 p BE EL B6 38 8E. flags 
参数 用 来 指定 此 内 存 段 是 否 为 只 读 。 

(3) infsp 53 3E A TE E ETT VE 79 3E 3.7 

sircpyCpir, "hello"; 

memepy() .ptr[i 及 其 他 一 些 遂 用 的 指针 操作 。 

3. 使 用 共享 凡 厂 段 的 时 间 / 日 期 服务 器 


sbn_ts,c ; the time server using shared memory. a bizarre application x/ 
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有 
finclude | «stdio.h 


# include «sys/shm.h- 


H include «time. h> 


#define TIME MEM KEY 99 /* like a filename */ 
H define SEG SIZE ((size t)100) /* size of segment «/ 
#define oops(m,x) { perror(m); exitGx); } 
main) 
i 

int seg id; 

char  »*mem ptr, * ctime(); 

long now; 

int n; 


f 


/x create a shared memory segment */ 


seg id - shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|0O777 ); 
if ( seg id -- 1? 


oops("shmget", 1}; 
/x attach to it and get a pointer to where it attaches */ 


mem ptr = shmat( seg id, NULL, 0 2; 
if ( mem ptr == ( void x ) — 1) 


oops("shmat", 2); 


/* run for a minute */ 


for(n-20; n«z60; nt t yi 


time( &now ); 
strcpy(mem ptr, ctime(&now)); 
sleep(1); 

} 


/* now remove it */ 


shmctl( seg id, IPC PMID, NULL); 


4, ER XR A AB GI 8] / VUL P3 
/* shm tc.c 


# include «stdio.h— 
d include  «sys/shm. h > 
# include <ctime.h> 


fe 
fx 
H define oops(m,x) { perror(m); exit(x); 


# define TIME MEM KEY 99 
p define SEG SIZE ((size t)100) 


/* get the time x/ 
/* write to mem =/ 


/* wait a sec */ 


; the time client using shared memory, a bizarre application */ 


kind of like a port number «/ 
size of segment */ 
} 
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maint} 
i 
int seg id; 
char — * mem ptr, * ctime(}; 
long now; 
/* create a shared memory segment x/ 
seg id = shmget( TIME MEM KEY, SEG SIZE, 077? ); 
if ( seg id == 12 
oops( "shnget",1); 
/* attach to it and get a pointer to where it attaches «/ 
mem ptr = shmatt seg id, NULL, 0 5; 
if ( mem ptr == ( void *) - 1) 
oopst"shmat",2); 


printf("The time, direct from memory; .. $s", mem ptr); 


sShmdt( mem ptr ); /* detach, but not needed here «/ 


\ 
D 


5. 共享 内 存 段 类 型 的 IPC 小 结 

Wi}: 客户 端 必 须 有 对 共享 内 存 段 的 读 权 了 上限。 共享 内 人 存 段 拥有 一 个 权限 系统 , 它 的 工作 
原理 和 文件 权 跟 系统 类 似 。 共 说 内 存 外 有 自已 的 拥有 者 并 且 为 用 户 、 组 或 其 他 成 员 设置 了 
权限 位 ,来 控制 他 们 各 自 的 访问 权限 。 正 因为 有 如 此 特性 , 才 可 以 让 服务 器 只 有 写 权 限 而 客 
J3$g FUB TSE AR AR . 

多 个 客户 , 任意 数目 的 客户 都 可 以 同时 从 共享 内 存 段 读数 据 . 

竞 态 条 件 : 服务 器 通过 调用 一 个 运行 在 用 户 空间 的 库 函 数 strcpy 来 更 新 共享 的 内 存 段 。 
如 时 客户 端正 好 在 服务 器 向 内 存 段 中 写 和 人 新 数据 的 时 候 来 访问 内 丰 段 ,那么 它 可 能 婚 读 到 
新 数据 也 读 到 老 数 据 。 

避免 竟 态 条 件 : 服务 器 和 客户 段 必须 使 用 相同 的 系统 来 对 资源 加 锁 。 内 核 提供 了 一 种 
进程 间 加 锁 的 机 制 , 称 为 信号 量 机 制 。 在 下 一 节 中 将 会 学 习 这 种 机 制 。 


15.3.5 各 种 进程 间 进 信 方 法 的 比较 


最 初 的 问题 是 如 和 何 使 一 个 进程 从 另 一 个 进程 得 到 字符 串 。 前 面 提 到 的 三 个 方法 都 可 以 
达到 要 求 。 客 户 端 从 服务 器 端 得 到 它们 想 要 的 数据 。 前 面 已 经 介绍 了 四 个 版 本 的 客户 / 服 
务 器 系统 ,其 至 还 可 以 写 出 使 用 数据 报 或 Unix 域 地 址 的 新 版 本 。 不 过 如 何 决定 到 底 用 如一 
Tt d EK AE? 有 什么 选择 标准 吗 ? 

《1) 速度 

通过 文件 或 命名 管道 米 传 输 数 据 需 要 更 儿 的 操作 。 系 统 内 核 将 数据 复制 到 内 核 空间 
中 ,然后 再 切换 回 用 户 宰 间 。 对 于 利用 文件 进行 传输 来 说 ,内 核 将 数据 复制 到 磁 执 上 ,然后 
将 数据 再 从 磁盘 复制 出 去 。 实 际 虐 ,在 存储 区 中 存储 数据 比 想 象 中 要 复杂 的 多 。 虚 概 内 
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存 系统 允许 用 户 空间 中 的 段 交换 到 磁盘 上 ,内 此 就 是 共享 内 存 段 机 制 同样 也 包括 了 对 磁盘 
的 读 写 操作 ， 

(2) 连接 和 无 连接 

文件 和 共享 内 存 段 就 像 公告 牌 一 样 。 数 据 产 生 者 将 信息 贴 在 公告 牌 上 ,多 个 消费 者 可 
以 同时 从 公告 牌 十 阅读 信息 。FIFQ 要 求 建立 连接 ,因为 在 内 核 转换 数据 之 前 ,读者 和 写 者 
都 必须 等 待 着 FIFO 被 打 关 ,并 且 也 只 有 一 个 客户 可 以 阅读 此 消息 。 流 socket 是 面向 连接 
的 ,而 数据 报 socket 则 不 是 。 在 某 些 应 用 程序 中 ,这 些 区 别 起 着 关键 性 的 作用 。 

(3) 范围 

你 希望 穆 序 中 的 消息 能 传送 多 远 的 此 离 呢 ” 共享 内 存 和 命名 管道 只 允许 本 机 上 的 进程 
之 间 通 信 。 通 过 文件 进行 传输 可 以 允许 不 同 机 器 上 的 进程 进行 通信 。 使 用 IP Hrs BS socket 
可 以 与 不 同 机 器 上 的 进程 进行 通信 ,而 使 用 Unix 地 址 的 socket 却 不 能 。 这 样 , 使 用 镭 一 种 
方法 进行 通信 就 披 决 于 通信 实体 癌 的 距离 了 。 

(4) 访问 限制 

你 是 希 认 所 有 人 都 能 与 服务 器 通信 还 是 只 有 特定 权限 的 用 户 才 行 ? 文件 .FIFO, 共 享 内 
存 以 及 Unix 地 址 socket 都 提供 标准 的 Unix 文件 系统 权限 。 而 Internet socket 则 不 行 。 

(5) 3E dS AE ÍT 

使 用 共享 内 存 和 共享 文件 要 比 使 用 管道 和 socket 麻烦 。 管 道 和 socket 是 由 内 核 来 管理 
的 队列 。 写 者 将 数据 放 进 一 端 ,而 读者 则 从 另 一 端 将 数据 读 出 ,进程 并 不 需要 考虑 其 内 部 
2H. 

然而 对 于 共享 文件 和 共享 内 存 的 访问 却 不 是 由 内 核 进 行 管理 的 。 如 果 某 进程 在 读 文 件 
的 过 程 中 , 另 一 个 进程 正在 对 文件 进行 重 写 , 读 进 程 读 到 的 很 可 能 就 是 不 完整 或 不 一 致 的 数 
据 。 下 一 节 将 会 介绍 文件 锁 和 信和 号 量 的 应 用 。 


15.4 进程 之 间 的 分 工 合作 


如 何 处 理 这 些 令 人 恼火 的 竞 态 条 件 呢 9 客户 和 服务 器 车 通过 共享 文件 或 肉 存 的 方式 来 
进行 通信 ,又 如 何 来 保证 它们 正常 运行 而 不 出 现 冲 突 呢 ? 它们 如 何 分 工 合作 ? 本 节 将 介绍 
进程 在 访问 共享 资源 时 所 使 用 的 按 术 : 文件 锁 和 信号 量 。 


15.4.1 文件 锁 


l. HARA HH 

考虑 两 种 类 型 的 问题 。 首先 , 当 客 户 试 图 读 取 文件 时 ,服务 器 正在 重 写 文 件 , 结 果 会 如 
何 呢 ? 客户 读 出 来 的 可 能 就 是 不 完整 的 数据 ， 上面 所 提 到 的 日 期 7 时间 此 务 器 不 太 可 能 遇 
到 这 个 问题 ,因为 其 消息 比较 短 , 重 写 时 间 较 少 。 但 如 果 是 天 气 预 报 服务 器 ,其 交互 的 消息 
EER SA RE RAE SM. A. HR Jg dE TER Ts EMR. AP ILE GR S28 
完成 之 后 才能 开始 该。 

再 考虑 一 下 正好 相反 的 情况 。 当 客户 正在 一 行 一 行 读 数据 的 时 候 , 服 务 器 罕 然 把 文件 
抢 过 来 ,将 内 容 删除 ,然后 开始 重 写 数 据 。 客 户 端 看 着 文件 从 自己 眼皮 底下 被 抢 过 去 而 无 能 


第 15 章 PR aa fs IPC) » 477 * 





居 力 。 因 此 , 当 客 户 在 读 取 文件 的 时 候 , 服 务 器 也 必须 等 待 客户 完成 。 其 他 的 客户 不 必 去 
等 ,内 为 多 个 进程 一 起 读 文 件 不 会 带 来 任何 风险 。 

为 了 避免 这 些 问题 ,需要 两 种类 型 的 锁 。 第 一 和 神 类 型 为 写 数 据 锁 , 它 告 诉 其 他 进程 :“ 我 
在 写 文 件 , 在 完成 之 前 任何 人 人 都 必须 等 待 .第 二 种 类 型 的 锁 为 读数 据 锁 , 它 告 诉 其 他 进程 : 
“我 在 读 文件 ,要 写 文件 必须 等 我 完成 ,要 读 文 件 的 不 受 影响 。” 

2. 使 用 文件 锁 进 行 编 程 

Unix 提供 了 3 种 方法 锁 住 打开 的 文件 : fock, lockt 和 fentl。 三 者 中 最 灵活 种 移植 性 最 
好 的 应 该 是 fentl, 

下 面 使 用 fent! 锁 文 件 。 

(1) 如何 给 已 经 打开 的 文件 加 读数 据 锁 ? 

使 用 fentl(fd,F_SETLKW,&.lockinfo) 

第 一 个 参数 是 该 文件 对 应 的 文件 描述 符 ， 第 二 个 参数 F_SFETIK 允 说 明 若 必要 的 话 , 可 
以 等 待 其 他 的 进程 释放 锁 。 第 二 个 参数 指向 一 个 struet flock 类 型 的 变量 。 下 列 代码 为 一 个 
文件 描述 符 没 置 读数 据 锁 : 


set read lock(int fd) 


i 
struct flock lockinfo; 


lockinfo.l type = F RDLCK; /* a read lock on a region »/ 
lockinfo.l pid = getpid(); /* for ME «/ 

lockinfo.l start = 0; /* starting 0 bytes from.. x/ 
lockinfo.l whence = SEEK SET; /* start of file x/ 

lockinfo.l len = 0; /* extending until EOF */ 


fentl(fd,F SETLKW,&lockinfo); 


1 
i 


C2) 如 何在 打开 的 文件 上 加 写 数据 锁 ? 
使 用 fontl dd, F_SETLKW, &lockinfo) ,并 将 lockinfo.] type # F_WRLCK, 
(3) 怎样 解锁 ? 
使 用 fentl(fd, F_SETLKW, &lockinfa) ,并 将 lockinfo. 1 type $ F UNLCK, 
(4) 如 何 只 锁 住 文件 的 一 部 分 ? 
使 用 fcnti(fd, F SETLKW , &lockinfo) ,并 将 lockinfo. 1_start 营 为 开始 位 置 的 偏 移 量 ， 
EHA lockinfo. llen BA pe sg 89H HE. 
3. 基于 文件 的 时 间 服 务 器 代码 
/* file ts.c - read the current date/time from a file 
x usage; file ts filename 
* action, writes the current time/date to filename 


* note; uses fentl() - based locking 


f 
ay 


# include <stdio. b> 
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# include < sys/file, h> 
#4 include <(fentl. ho 
# include time. h> 


d define oops(m,x) { perror(m); exit(x); | 


main(int ac, char *av[]) 
{ 

int fd; 

time t now; 


char * message; 


if (Cac l= 23{ 
fprintf(stderr, "usage; file ts filenameXn") ; 
exit(l); 


} 
if ( (fd = open(av[1],O CREAT|O TRUNC|O WRONLY,0644)) == -1) 
oops(av[1],25; 


While(l) 


{ 


time(&now); 


message = ctime(&now); /* compute time x/ 
lock operation(fd, F_WRLCK) ; /* lock for writing */ 
if ( lseek(fd, OL, SEEK SET) == -1) 

oops("lseek", 3) ; 
if ( write(fd, message, strlen(message)) == -— 1) 


ocops( "write", 42; 


lock operation(fd, F UNLCK); /* unlock file x/ 


sleep(1); /* wait for new time */ 


lock_operation( int fd, int ep) 
{ 
struct flock lock; 


lock.l whence = SEEK SET; 
lock.l start = lock.l len = 0; 
lack.l pid = getpid(); 

lock.l type = op; 


if ( fcntli(fd, F SETLKW, &lock) == -1) 


oops("lock operation", 6); 
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4, 


基于 文件 的 时 间 服 务 客 户 端 代码 


/* file tc.c - read the current date/time from a file 


usage, file tc filename 


uses; fentl() — based locking 


4 include «{stdio. h> 
# include <sys/file, h> 
# include «< fentl. h> 


+ define oops(m,x) { perror(m); exit(x); } 
# define BUFLEN 10 


main(int ac, char + av[]) 


H 
$ 


int fd, nread; 
char buf [BUFLEN] » 


if (ac |= 20)1 
fprintf(stderr, "usage: file tc filename\n"); 
exit(1); 

} 


if ( (fd= apen(av[1],0 RDONLY)) == -1) 
oops(av[ 17,3); 


lock operation(fd, F_RDLCK); 


while( (nread = read(fd, buf, BUFLEN)) > 0) 


write(l, buf, nread ); 
lock operation(fd, F UNLCK); 


close(feD; 


lock operationtint fd, int op) 


{ 


struct flock lock; 


lock. 1] whence = SEEK SET; 
lock.l start = lock.l len = 0; 
lock, 1 pid = getpid(); 

lock.l type = op; 


if ( fentl(fd, F_SETLKW, &lock) == -1) 


oopst "lock operation", 6); 
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5. SAR, 小 结 

使 用 F_SETLKW 参数 调用 fentl 可 以 使 进程 挂 起 直到 内 核 允许 进程 设置 指定 的 锁 。 在 
读 取 数 据 之 前 ,客户 必须 设置 读 取 数据 的 锁 。 若 服务 器 对 文件 加 写 数据 锁 , 客 户 只 好 等 待 服 
务 器 完成 。 服 务 器 在 重 写 数据 之 前 ,也 必须 对 文件 加 写 数据 锁 , 如 果 这 时 客户 加 了 一 个 读数 
据 的 锁 , 那 服务 器 会 被 挂 起 直到 所 有 客户 释放 这 个 锁 。 

6. 重要 细节 : 进程 可 以 忽略 镇 机制 

在 前 面 对 于 文件 锁 的 讨论 中 ,不 管 客户 还 是 服务 器 在 读 或 修改 文件 的 时 候 , 程 序 都 是 自 
觉 有 序 地 等 待 , 设 置 及 释放 文件 锁 。 那 么 当 别 的 进程 设置 了 锁 的 时 候 , 其 他 进程 是 否 可 以 忽 
略 它 , 仍 旧 继 续 原 来 的 读 取 或 是 修改 操作 吗 ? 答案 是 肯定 的 。Unix 的 锁 机 制 允许 进程 通过 
这 种 方式 合作 ,但 并 不 强 追 它们 一 定 要 用 。 | 


15.4.2 4834 (Semaphores) 


fr dcr ALAN FE BLE AR B8 [H1 / A Se Re AO EA EO BE) 
7 日 期 系统 中 的 文件 是 相同 的 。 前 面 介绍 了 用 锁 的 机 制 来 解决 访问 文件 的 冲 罕 , 共 享 内 存 段 
如 柯 来 避免 数据 冲突 呢 ? 在 共享 内 存 段 中 是 否 也 存 看 着 读数 据 锁 和 和 写 数 据 锁 的 概念 ?不 
是 ,但 进程 使 用 一 个 更 如 灵活 的 机 制 来 合作 ; fim. 

信号 和 量 是 一 个 内 核 变 量 , 它 可 以 被 系统 中 的 任何 进 午 所 访问 。 进 程 间 可 以 使 用 这 个 变 
量 来 协调 对 于 共享 内 存 和 其 他 资源 的 访问 。 上 一 章 讨论 了 如 何在 特定 的 情况 尾 生 时 使 用 条 
件 变 量 来 通知 其 他 线程 。 条 件 对 象 是 进程 中 的 全 局 变量 ,而 信号 量 则 是 系统 中 的 全 局 变量 。 

在 时 间 / 日 期 服务 器 和 客户 端 程 序 中 ,如 何 来 使 用 信号 量 呢 ? 

1. 计数 器 及 其 揉 作 

在 无 客户 读 取 的 时 候 , 服 务 器 将 数据 写 人 共享 内 存 段 中 。 同 样 地 ,在 服务 器 没有 对 共享 
内 存 段 进行 写 操 作 的 时 候 , 客 户 可 以 读 到 数据 。 可 以 将 这 些 规则 转换 为 关于 变量 值 的 表 
AR: 

+ 客户 端 等 待 直 到 number of writers == 0 

© 服务 器 等 待 直 到 number of readers == 0 

信号 量 是 系统 级 的 全 局 变量 ,这 里 可 以 使 用 两 个 信号 量 分 别 代 表 读 者 数 和 写 者 数 。 管 
理 者 写 变量 需要 两 个 操作 。 ` 

举例 来 说 ,读者 必须 等 待 写 者 数 为 零 的 时 候 , 才 可 以 将 读者 数 加 1。 当 荣 读者 读 完 数据 ， 
读者 数 必须 被 减 一 。 

同样 地 , 写 者 也 必须 等 待 读者 数 为 零 的 时 候 , 才 可 以 将 写 者 数 加 1。 等 待 恋 者 数 为 零 以 
及 将 写 者 数 如 1 是 两 个 独立 的 操作 ,必须 分 开 执行 , 即 这 两 个 操作 都 是 原子 操作 。 通 过 使 用 
信和 号 量 来 通信 的 进程 可 以 使 用 若干 个 这 样 的 变量 ,并且 独 立地 进行 这 些 原 子 操作 。 

这 就 是 信号 量 机 制 的 工作 原理 。 进 牺 可 以 同时 处 理 一 组 信号 量 上 的 多 个 操作 。 

2. 一 组 信号 量 、 多 个 活动 

时 间 服 务 吕 系统 使 用 两 个 信号 量 ,如 图 15.8 所 示 , 并 且 读 者 和 写 韦 需 同时 对 两 个 活动 集 
进行 操作 . 
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num rd num wri 


A 15.8 (E Str EL. num readers, num writers 


在 修改 共享 内 存 之 前 ,服务 器 必须 先 对 这 组 活动 集 进 行 操 作 : 
* [0] 等 候 num readers 变 成 0 

* [1] A. num writers Ji 1 

当 般 务 器 完成 写 操 作 之 后 , 它 必须 再 对 下 面 这 组 活动 集 进行 操作 : 
* [0] Y num, writers X ] 

在 客户 恋 取 共享 内 存 之 前 ,必须 对 下 面 这 组 活动 集 进行 操作 : 
*[0] 等 待 num writers 变 成 0 

* [11 # num readers fn 1 

当 窜 户 完成 任务 之 后 , 知 要 对 下 面 这 组 活动 集 进行 操作 、: 

* [0] 将 num readers X 1 

3， 服 务 器 版 本 : shm is2.c 

给 原来 的 程序 shm_is. e 添加 信号 量 得 到 shm_ts2.c, 


/* shm ts2.c — time server shared mem ver2 , use semaphores for locking 
* program uses shared memory with key 99 

* program uses semaphore seL with key 9900 

*/ 


H include <stdio.h> 

# include «<sys/shm. h> 

f include «time. h> 

# include <sys/types.h> 
# include  «sys/sem. h> 

# include «signal. h> 


Hdefine TIME MEM KEY 99 /* like a filename «/ 
# define TIME_SEM KEY 9900 
# define SEG SIZE ((size t)100) /* size of segment »/ 


# define ocops(m,x) | perror(m); exit(x): } 


union semun ( int val ; struct semid ds » buf ; ushort w array; }; 
int seg id, semset id; /* global For cleanup() «/ 


void cleanupl int); 
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í 
char * wem plr, * ctimeQ; 
time t now; 


int n: 


/* create a shared memory segment «/ 





seg id = shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|0777 ); 


if ( seg id == -1) 
oops("shmget", 1); 


/* attach to it and get a pointer to where it attaches «/ 


mem ptr = shmat( seg id, NULL, 0 2; 
if ( mem ptr == ( void *) -1) 


oops("shmat", 2); 


/* create a semset, key 9900, 2 semaphores, and mode rw - 


semset id - semget( TIME SEM KEY, 2, 
(06656|IPC CREAT|IRC - 


if ( semset id == -1) 
oops("semget", 3); 


set sem value( semset id, 0, 05; 


set sem value( semset id, 1, 0); 
signal(SIGINT, cleanup); 


/* run for a minute */ 
for (n=0; n60; n* * 34 


time( &now 5; 





EXCL} ); 


printf("Atshm ts2 waiting for lock\n"); 


wait and lock(semset id); 


printf("\tshm_ts2 updating memory\\n"™} ; 


strcpy (mem ptr, ctime(&now)); 


sleep(5); 
release_lock(semset_id}; 


printf("\tshn_ts2 released lockin"); 


sleep 1}; 


cleanup DJ) ; 
t 


void cleanup(int n? 


{ 


shmctl( seg id, IPC RMID, NULL); 


rw-rwes/ 


/* set counters x*/ 


/* both to zero «/ 


/* get the time &/ 
/* lock memory xy 
/* write to mem «/ 
/* unlock */ 


/* wait a sec +’ 


/* rm shrd mem «/ 
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semctl( semset id, 0, IPC RMID, NULL); 


PE 


* initialize a semaphore 


xf 


/* rm sem get «/ 


set sem value(int semset id, int semnum, int val) 


{ 


union gemun initval; 


initval. val 


= val; - 


if ( semctl(semset id, semnum, SETVAL, initval} == ~ 1) 


cops("semctl", 4); 


f 


TR 


* build and execute a 2 — element action set, 


* wait for 0 on n readers AND increment n writers 


*/ 


wait and lock( int semset id ) 





1 
struct sembuf actions[2!; /* action set «/ 
actions[0].sem num = 0; /* sem[ 0] is n readers «/ 
actions[0].sem flg = SEM UNDO; /* auto cleanup x/ 
actions[0|.sem op = 0; /* wait til no readers */ 
actions[1].sem num = 1; /* sem[ 1] is n writerg w/ 
actions(1].sem flg = SEM UNDO; /* auto cleanup */ 
actions ll.sem op = 41; /* incr num writers x/ 
if ( semop( semset id, actions, 2) == 一 1 ) 

oops("semop; locking", 10); 
i 
P 


* build and execute a 1 - element action set. 


* decrement num writers 


af 


release lock( int semset_id ) 


1 


struct sembuf actions|1]; 


actions[0 .sem num = 1; 
actions[D].sem flg = SEM UNDO; 
actions[0].sem op = - 1i ; 


if ( semop( semset id, actions, 1) 


oops("semop: unlocking", 10); 


/* action set x/ 


/* sem[ 0; is n writerS «/ 
/* auto cleanup +/ 


/* decr writer count x*/ 


233 


« 484 * Unix/Linux WARRE 





I FL cp s M fer d ERR S a Se PY 5 个 步骤 ， 

(D Mees ak 

semset id = semget(key ! key, int numsems, int flags) 

semget MAA T — TRE numsems 个 信号 量 的 集合 。shm_ts2 程序 创建 了 包含 两 个 
信号 量 的 集合 。 此 集合 所 拥有 的 权限 模式 是 0666， 郴 数 semget 返回 此 信号 量 集 的 iD。 

(2) 将 所 有 的 信号 量 置 0 

semctl(int semset id, int semnum, int cmd, union semun arg? 

这 里 使 用 semt) 来 对 信和 号 量 集 进行 控制 。 此 函数 的 第 一 个 参数 是 此 集合 的 ID, 第 二 个 
参数 是 集合 中 某 特定 信号 量 的 号 码 , 第 三 个 参数 是 控制 命令 。 如 果 此 控制 命令 需要 参数 , 那 
么 使 用 第 四 个 参数 向 共 提 供 所 需 的 参数 。 在 shm_ts2 中 ,使 用 SETVAL 命令 来 给 每 一 个 信 
SER- CHEF., | 

(3) 等 待 所 有 读者 完成 任务 之 后 ,服务 器 将 nam, writers 加 1 

semop(int semid, struct sembuf * actions, size_t numactions) 

函数 semop 对 信号 量 集 完 成 一 组 操作 。 第 一 个 参数 用 来 指定 信号 量 集 。 第 二 个 参数 是 
一 组 活动 的 数组 。 最 后 一 个 参数 则 是 该 数组 的 大 小 。 集 合 中 的 每 一 个 活动 都 是 一 个 结构 
体 , 它 的 作用 就 是 “使 用 选项 sem flg 来 完成 对 号 码 为 sem. num 的 信和 导 量 的 操作 sem. op". 
整个 活动 集合 被 作为 组 来 完成 ,这 一 点 是 关键 。 上 面 程序 中 的 函数 wait end lock 完成 两 个 
操作 : 等 待 读者 数 到 零 ,然后 将 写 者 数 加 1。 这 里 建 了 一 个 包 售 这 两 个 活动 的 数组 。 英 动 9 
所 要 完成 的 事情 就 是 “等 待 信号 量 0 变 成 0”。 而 活动 1 要 完成 的 功能 则 是 “将 信号 量 1 加 
i"。 进 程 挂 起 直到 这 两 个 活动 都 被 完成 。 只 要 读者 计数 器 一 变 成 0, 写 者 计数 器 立即 加 1, 然 
后 semop PR $UR [el 。 . l 

使 用 SEM. UNDO 标志 多 许 内 核 在 进程 退出 的 时 候 依 复 这 些 操作 。 在 上 面 这 个 程序 
中 , 当 写 者 计数 器 被 加 1 的 时 候 , 共 享 内 存 自 是 被 锁 住 的 。 如 果 在 对 此 计数 器 做 减 1 操作 之 
前 ,进程 非法 终止 ,其 他 进程 则 永远 无 法 读 取 共享 内 存 段 的 内 容 了 。 

(4) Xf num writers 9X 1 

在 release lock 函数 中 ,只 需 完成 一 件 事 情 : 对 写 者 数 减 1。 这 里 使 用 一 个 只 包含 该 活 
动 的 数组 作为 参数 来 调用 semop 函数 ,从 而 完成 对 写 者 数目 的 修改 。 如 果 这 时 某 客 户 正在 
等 待 , 它 立即 就 可 以 继续 执行 读 操 作 了 。 

(5) 删除 信号 量 

semctl(semset_id, 0, IPC_RMID, 0) 

任务 完成 之 后 ,服务 器 再 次 调用 semetl 函数 ,不 过 这 次 的 目的 是 删除 信号 量 。 

4. PRBE. hm, tc2.c 

客户 端的 设计 相对 容易 得 多 。 在 程序 shm tc 中 , 既 不 初始 化 信号 量 也 不 删除 它们 。 





/* ghm tc2.c — time client shared mem ver2 ; use semaphores for locking 


* program uses shared memory with key 99 
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* program uses semaphore set with key 9900 


] 


F include 
# include 
# include 
+ include 
# include 
# include 


# define 


# define 
# def ine 
# define 


union semun | int val 


main() 


{ 


int 


< stdio. hi> 
«asys/shm. h> 

< time. h> 

< sys/ types. k> 
< SYS: ipc. ho 


<(sys/sem. h> 
TIME MEM KEY 99 /* kind of like a port number */ 


TIME SEM KEY 9900 /* like a filename »/ 
SEG SIZE [(size t)100) /* size of segment x/ 
cops(m,x) { perror(m); exit(x); } 


; struct semid ds * buf ; ushort x array, }; 


, 


seq id; 


char * mem ptr, * ctime(); 


long now; 


int 


semset id; /* id for semaphore set x/ 


/* create a shared memory segment x/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ); 
if { seg id == -1) 


oops( "shnget",1); 


/* attach to it and get a pointer to where it attaches */ 


mem ptr = shmat( seg id, NULL, 0 5; 


if ( mem ptr == ( void *) - 1) 
oops( "shmat",2); 


/* connect to semaphore set 9900 with 2 semaphores */ 


semset id = semget( TIME SEM KEY, 2, 0); 


wait and lock( semset id ); 


printf("The time, direct from memory; .. *s", mem ptr): 


release lock( semset id); 
shmdt( mem ptr ); /* detach, but not needed here x/ 


fx 


* build and execute a 2- element action set: 


* wait for 0 on n writers AND increment n readers 


x/ 
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wait and lock( int semset id) 


i 
1 


union semun sem info; 


struct sembuf actions[2]; 


actions[O].sem num = 


actions[0:.sem flg 


AES 


f 


/* some properties x/ 
/* action set x/ 


/* sem[ 1] is n writers */ 


SEM UNDO; /* auto cleanup «/ 


actions|0].sem op = 0; 


/* wait for 0 x/ 


actions[1].sem num = 0; jx sem 0] is n readers «/ 
actions[1].sem flg - SEM UNDO; /* auto cleanup */ 
actions[1].sem_op = +1 ; /* incr n readers */ 

if ( semop( semset id, actions, 2) == -1 } 


oops("semop. locking", 10); 


} 


/* 


* build and execute a 1 — element action set; 


* decrement num readers 


gf 


i 


release_lock( int semset_id ) 


{ 


union semun sem_info; 


struct sembuf actions[1]; 


actions[0].sem num = 0; 


actions[0..sem flg 


actions[ 0]. sem, op 


/* some properties x,’ 
/* action set x/ 


/* sen[ 0] is n readers xy 


SEM UNDO; /*x auto cleanup x*/ 


-1 - 


r 


/* decr reader count «/ 


if ( semopl semset id, actions, 1) == -1) 


nopst "semop: unlocking", 10); 


ase 


编译 并 对 程序 做 如 下 的 测试 ; 


$ cc shm_ts2.c - o shmsery 


5 cc shm tc2.c - o shnclnt 


$ ./shnservk 
[1] 15533 


shm ts2 waiting for lock 


shm_ts2 updating memory 
shm ts2 released lock 


shm_ts2 waiting for lock 


shm ts2 updating memory 


S ./shmclnt 


shm_ts2 released lock 


The time, direct from memory: .. Sat Oct 27 17.36,34 2001 


§ shm_ts2 waiting for lock 


shm ts2 updating memory 
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S ./shmcint 
shm ts2 released lock 
The time, direct from memory; .. Sat Oct 27 17,36,40 2001 
5 shm ts2 waiting for lock 
ipes 
二 Shared Memory Segments 一 -一 一 一 -一 
key shmid owner perms bytes  nattch status 
0x00000063 30670854 bruce 777 100 1 
- ---- Semaphore Arrays -------- 
key shmid owner perms  nsems status 
Ox000026ac 262146 bruce 666 2 
---—--- Message Queues 一 -一 一 一 一 


key msqid owner perms used- bytes messages 


S shm_ts2 released lock 
shm_ts2 waiting for lock 
$ kill - INT 15533 


$ semop; unlocking: Invalid argument 


上 面 对 程 序 的 测试 展示 了 客户 端 如 何等 待 服 务 器 解锁 。 许 多 客户 可 以 同时 运行 ,每 一 
客户 等 待 服务 器 计数 器 变化 到 0, 然后 对 客户 计数 器 加 1。 如 果 三 个 客户 同时 从 共享 内 存 中 
读 取 数据 ,读者 计数 器 也 将 是 三 个 。 服 务 器 只 好 等 二 个 客户 的 读者 计数 器 都 变 为 0 时 , 才 可 
以 进行 数据 的 写 操作 ，。 

程序 中 并 没有 对 可 能 出 现 的 所 有 和 情况 进行 处 理 。 具 体 来 说 ,如 何 防止 两 个 服务 器 程序 
同时 运行 ?在 我 们 的 程序 中 ,服务 器 仅仅 等 待 客户 的 读者 服务 器 变 为 0 而 并 没有 对 其 他 服务 
器 的 写 者 计数 器 进行 判断 。 

5. 等 待 某 信 号 量变 为 正 豆 

RPMS CE HR RMS ARS RAS, HATS 器 等 待 着 客户 端的 读 考 信和 号 量 
变 为 零 。 介 在 其 他 的 程序 中 ,也 许 希 户 等待 的 是 某 个 信号 量变 成 正 数值 。 举 倒 来 说 ,也 许 希 
望 等 待 信号 量 的 值 变 为 2。 如何 来 写 这 样 的 程序 呢 ? 

这 里 使 用 一 个 不 太 直接 的 方法 : 让 系统 内 核对 信号 旦 做 减 2 操作 。 信 号 量 不 允许 为 负 
值 ,因此 系统 内 核 将 调用 挂 起 直到 和 信号 量 的 值 大 于 或 等 于 2。 信号 量 一 且 达 到 2, 某 进程 就 对 
它 做 减 2 操作 ,然后 把 任何 其 他 要 对 这 个 信号 基 减 2 的 进程 挂 起 。 

这 个 操作 的 sem op 成 员工 作 方 式 如 下 。 

* XP sem op 是 正 值 ,活动 ; 通过 sem op 函数 对 信号 量 减 2。 

* 车 sem_op HS ,活动 : 挂 起 直到 信号 量 等 于 0。 

* X sem op 是 负 值 ,活动 ; 挂 起 直到 信号 量变 成 赴 值 。 


15.4.3 socket 及 FIFO 与 共享 的 存储 


本 章 的 前 面部 分 写 了 四 个 版 本 的 时 间 / 日 期 服务 器 和 客户 端 程序 。socket 版 本 和 FIFO 
版 本 要 相对 容易 些 。 客 户 端 连 接 到 服务 器 ,服务 器 发 送 数 据 , 然 后 服务 器 进程 挂 起 。 虽 然 共 





» 488 » Unix/Linux 编程 实践 教程 








享 肉 存 和 文件 的 版 本 看 上 去 很 简单 ,但 它们 需要 锁 和 信号 量 机 制 来 保护 数据 。 要 知 韶 扣 入 
锁 和 信号 量 也 是 相当 复杂 的 一 件 事 ， 

然而 文件 和 共 至 内 存 机 人 制 允 许多 客户 端 同 时 从 服务 器 读 取 数据 ,允许 客户 端 和 扔 务 器 
在 不 同 的 时 刻 运行 ,并 且 当 进程 凡尘 时 ,人 允许 数据 的 保持 和 恢复 。 

管道 和 socket 也 包含 了 锁 的 机 制 。 管 道 和 socket 其 实 也 是 保存 数据 的 内 存 段 . 它 将 数 
据 从 源 端 复制 到 目的 端 。 不 同 的 是 管道 和 socket 中 的 锁 和 信和 号 量 是 由 内 核 ,而 不 是 由 赴 各 
来 管理 的 。 


15.5 打 Al idu 


在 时 间 / 有 日 期 程序 中 ,服务 器 发 数据 给 客户 端 。 然 而 另外 的 一 些 程序 却 是 以 截然 不 同 的 
方式 工作 : 多 客户 端 发 数据 给 服务 器 ,例如 打印 服务 器 上 的 打印 地。 那么 这 种 类 型 的 程序 如 
何 来 设计 呢 ? 


15.5.1 多 个 写 者 、 一 个 读者 

如 图 15.9 Bros .多用 户 共享 一 个 打印 机 。 如 何 使 用 客户 端 / 服 务 器 模型 来 设计 一 个 共享 
打印 机 的 程序 呢 ? 多 个 用 户 可 能 会 在 同时 发 送 打 印 请 求 , 但 是 打印 机 在 某 一 时 刻 只 能 打印 
一 个 文件 .打印 程序 就 必须 接收 多 个 并 发 的 输入 ,并 将 单个 的 箱 出 流 送 到 打印 设备 上 .如 
何 来 写 这 个 服务 器 程序 呢 ? 它们 之 问 又 如 何 通 信 呢 ? 





人 打印 机 打印 机 任务 队列 一 此 同步 的 打印 机 请 求 
R 15.9 多 个 数据 源 .一 个 打印 机 


这 个 程序 由 哪些 功能 单元 组 成 ”这 些 单元 之 同 又 传递 孵 些 数据 和 消息 呢 ? 









printer 


15.10. 将 一 个 文件 传 给 打印 村 


在 Unix 系统 中 打印 文件 的 最 简单 方法 就 是 使 用 如 下 命令 . 


cat filename > /dev/ip) 或 者 cp filename /dev/lpi 
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这 里 /devyjpl 是 打印 机 设备 文件 的 名 称 ， 当 然 系 统 中 打印 设备 文件 名 称 并 不 一 定 和 上 
面 的 一 样 ,但 在 Unix 系统 中 将 数据 传 给 打印 机 或 其 他 设备 的 惟一 方法 就 是 通过 open FF 
文件 ,然后 使 用 write 系统 调用 将 数据 写 至 打印 文件 中 ， 

可 以 使 用 写 数 据 锁 吗 ? 

大 家 已 经 学 习 过 写 数据 锁 和 信和 号 量 机 制 了 。 为 什么 不 可 以 自己 写 一 个 cat 或 cp 的 打印 
程序 ,让 它 通过 写 数据 锁 来 防止 对 设备 文件 的 同步 访问 冲突 呢 ? 

基于 锁 机 人 制 的 文件 复制 程序 确实 没有 各 题 。 考 虑 一 下 对 打印 机 加 锁 后 ,结果 会 怎样， 
若 某 程序 对 打印 机 加 锁 , 其 他 的 文件 复制 程序 都 必须 挂 起 等 待 第 一 个 程序 完成 任务 并 生 放 
Uh. BAT - RRIF AAR? 内 核 将 所 有 挂 起 进程 中 的 一 个 唤醒 ,但 是 这 个 进程 却 不 
一 定 就 是 排 在 第 二 的 。 最 然 这 样 的 决定 有 失 公 平 。 人 允许 用 户 通过 复制 数据 到 打印 设备 文件 
来 实现 打印 还 有 另 一 个 问题 : 车 有 些 人 试图 作假 ,他 们 可 以 不 使 用 这 样 一 个 加 锁 的 程序 来 打 
印 。 第 三 个 问题 则 是 某 些 文件 需要 特殊 的 处 理 。 例 如 图 像 文 件 有 可 能 需要 被 转换 为 打印 机 
可 以 看 得 尾 的 图 像 命令 。 很 多 用 户 并 不 知道 如 何 将 数据 转换 成 通用 的 格式 ,那么 他 们 就 得 
不 到 正确 的 结果 。 然 而 这 所 有 的 问题 都 可 以 由 集中 化 (客户 /服务 侨 模 式 ) 来 解决 。 


15.5.2 客户 /服务 器 模型 


程序 的 客户 /服务 器 模 现 解决 了 前 面 提 到 过 的 打印 的 问题 。 只 有 一 种 称 为 线性 打印 精 
X Cline printer daemon) 的 服务 器 程序 有 权限 去 写 数 据 到 打印 设备 文件 中 ,而 其 他 的 用 户 进 
程 则 不 行 (如 图 15. 11 所 孙 )。 当 用 户 需 要 打印 文件 的 时 候 , 他 们 运行 一 个 称 为 Ipr 的 客户 端 
RUF. lpr 对 文件 做 了 一 个 复制 ,然后 将 复制 的 文件 放 在 打印 任务 队列 中 。 用 户 可 以 删除 或 
编辑 这 个 文件 。 并且 打印 精灵 程序 可 以 将 图 片 和 格式 做 转换 以 使 得 它们 能 够 正确 地 被 打印 
出 来 。 


client 





图 15.11 客户 /服务 器 模型 的 打印 系统 


客户 澳 和 服务 器 如 何 遂 信 呢 ?它们 交互 哪些 数据 ? 客户 端 将 整个 文件 传 给 服务 器 还 是 
客户 端 仅 仅 将 文件 名 传 给 服务 器 呢 ? 如 果 服 务 器 和 客户 不 是 在 同一 台 机 器 上 ,情况 又 将 如 
f? 这 是 否 影 响 到 对 通信 方式 的 选择 呢 ? 不 同 版 本 的 Unix 中 在 不 同 的 打印 系统 : 有 些 使 用 
socket, 有 些 使 用 命名 管道 ,而 另外 一 些 仅 使 用 fork 和 文件 。 

是 硅 使 用 集中 化 的 客户 /服务 器 模式 就 可 以 不 使 用 锁 机 制 来 避免 冲突 了 ”可 以 把 系统 
设计 成 一 个 通过 构件 进行 通信 和 合作 的 模型 来 打印 一 台 机 器 上 的 文件 ,也 可 以 用 来 打印 
Internet 上 的 文件 。 可 以 将 你 自己 的 思路 和 不同 版 本 的 Unix 打印 系统 的 设计 思路 做 一 个 
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15.6 4 X IPC 


本 章 已 经 介绍 过 备 种 形式 的 进程 间 通 信 方 法 。 下 面 是 一 个 小 结 。 






















































































































































方 法 类 型 是 否 可 以 使 用 在 不 同 的 进程 awe 
不 同 机 器 上 P/C Sib Unrel 
! SES UP 
exec/ wait M "m 
environ M d eer ES ME 
pipe 1 S 1 * =. F 
kill-signal M * x ie : 
inet socket 5 x y 7 | E 3 
inet socket — M * 2 zie ord | 2 5 
Unix socket 8 ? ? ; % 7 
EET socket M i 5 
named pipe | S | 引信 二 人 9 
shared mem R 7 
msg queue M E E : 
oe files R ? - 
variables M 3 
file locks B C z 
semaphores C 2 
mutexes > : 














A ESI. 

P/C — 2S FRE 

Sib 一 -兄弟 关系 

Unrei- -EKHE 

M- 一 发 送 消息 

S— AR AS PR 
R 一 一 随机 读 取 数据 

C 一 - -用 来 使 任务 网 步 或 人 台 作 
+ 一 -适当 的 应 刺 


? 一 -不 适当 的 应 用 
N- 一 笑 合 庶 用 在 网 绪 文 件 系统 上 


上 面 的 这 上 张 表 并 不 包含 贝尔 实验 罕 的 网 络 工具 TLI 以 及 它 的 后 绪 产 品 。 
RUF: 


* fork- execv- argv exit- wait 
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用 于 使 用 一 组 参数 来 调用 某 个 程序 ,被 调用 频数 将 一 个 整 型 值 返回 给 其 调用 者 。 父 进 
程 通 过 使 用 fork 来 创建 一 个 新 的 进程 。 在 此 新 进程 中 的 程序 可 以 通过 调用 execv 来 运行 新 
的 程序 ,并 传递 给 新 程序 一 组 参数。 于 进程 通过 使 用 exit 传 回 一 个 返回 值 ;同时 父 进 程 使 用 
wait 米 接收 这 个 返回 值 ， 

这 一 组 调用 是 面向 消息 的 ,它们 和 仪 仅 可 以 熏 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 ， 

* environ 

系统 调用 exec 3 E —- 1 04 fit environ 的 系统 全 局 变量 自动 将 一 组 字符 串 复 制 进 新 的 程 
序 中 。 此 方法 允许 进程 传 值 给 子 进程 。 由 于 整个 环境 被 复制 给 子 进程 , 子 进程 无 法 改变 父 
进程 的 运行 环境 。 | 

此 方法 也 尾 面 向 对 象 的 ., 单 向 的 ,仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 。 

* pipe 

管道 是 由 进程 创建 的 单 向 数据 流 。 它 包含 连 搂 到 内 核 上 的 文件 措 述 符 。 写 进 一 个 文件 
描述 符 的 数据 可 以 从 另 一 个 文件 描述 符 读 出 来 。 奶 果 进 程 在 创建 管道 之 后 调用 了 fork, BBA 
新 的 进程 就 可 以 通过 间 样 的 管道 读 写 数据 ， 

此 方法 是 商 向 流 的 ,通常 为 单 向 传输 ,也 仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 
上 上 使用， 

* kill—signal 

信号 (signal) 是 一 条 从 一 个 进程 发 往 另 一 个 进程 的 整 型 消息 (使 用 kill 系统 调用 )。 接 收 进 
程 可 以 通过 使 用 signal 系统 调用 来 安排 一 个 处 理 者 隆 数 ,此 匡 数 在 信和 号 到 来 的 时 候 被 调用 。 

此 方法 是 面向 消息 的 , 某 -- 村 刻 单 向 的 ,进程 必须 拥有 相间 的 用 户 ID, 且 只 能 在 单机 上 
使 用 。 | | 

* Internet sockets 

Internet sockets 是 这 样 一 条 链接 , 它 的 两 个 端点 是 通过 特定 的 端口 导 建立 超 来 的 。 字 
MIT socket 进行 传输 ,从 一 个 进程 到 达 另 一 个 进程 ,类 似 于 某 人 在 波士顿 条 电话 给 在 东 
京 的 朋友 。Internet sockets 有 两 种 主要 的 实现 方式 : M socket 和 数据 报 socket, KPI 
叮 以 双向 传输 。 流 socket 更 类 似 于 文件 描述 符 : 程序 员 使 用 write 和 read 调用 来 发 送 和 接 
收 数 据 。 数 据 报 socket 则 类 似 于 明信片 ; 号 者 将 缓存 中 的 一 块 数 据 发 给 读者 。 所 有 的 交互 
部 是 以 数据 缓存 的 形式 完成 ,而 不 是 字 节 流 。 

有 面向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,可 以 通过 网 络 传 输 
数据 。 

* Named Sockels 

命名 socket, X. Ff Unix 域 socket。 它 使 用 文件 名 作为 地 址 而 不 是 主机 名 一 端口 号 对 ， 
命名 socket 同时 支持 流 和 数据 报 版 本 。 因 为 这 种 方式 使 用 文件 名 而 不 是 主机 一 端口 作为 地 
ht, sis 它们 仅仅 可 以 连接 同一 机 器 上 的 进程 ， 

这 种 方法 有 而 向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,只 能 工作 
存单 机上。 

* Named Pipes(FIFOs) 

命名 管道 的 工作 方式 类 似 于 一 个 常规 管道 ,但 是 它 可 以 连接 其 个 无 关 的 进程 。 命 名 管 
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道 由 文件 名 来 标志 。 写 者 使 用 open 调用 来 打开 文件 并 写 数据 ,读者 间 样 使 用 open 调用 打开 
文件 读数 据 。 这 种 方法 比 命名 socket 使 用 起 来 方便 很 多 ,但 是 它 只 可 以 单 向 传输 。 

此 方法 是 单 向 传输 的 .面向 流 的 ,可 以 连接 无 关 进 程 , 只 能 工作 在 单机 .上 . 

* File Locks 

Unix 人 允许 进程 对 文件 的 访问 设置 锁 。 进 程 可 以 对 文件 的 某 一 段 加 锁 , 使 自己 可 以 单独 
地 对 这 一 段 进行 改动 。 另 一 个 试图 锁 住 此 文件 的 进程 将 被 挂 起 ,直到 这 个 文件 被 解锁 。 文 
件 锁 机 制 允 许 进程 同 进 行 通信 ,让 所 有 的 进程 都 知道 是 哪 一 个 进程 正在 读 取 或 柳 改 文件 ， 
这 里 可 以 使 用 系统 调用 flock. lockf 和 fcntl 来 设置 或 测试 文件 锁 。 在 某 些 系统 中 ,这些 锁 是 
被 强制 加 上 的 。 

这 种 方法 面向 消息 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 。 

* Shared Memory 

每 个 进程 都 有 其 自己 的 数据 空间 。 程 序 所 定义 的 任何 变量 或 在 运行 时 刻 分 配 的 空间 都 
只 有 对 该 进程 是 可 见 的 。 进 程 可 以 通过 使 用 shmget 和 shmat 调用 来 创建 可 以 被 多 个 进程 
共享 的 内 存 段 。 由 一 个 进程 写 人 共享 内 存 段 的 数据 可 以 被 出 的 对 此 内 存 段 有 访 癌 权限 的 进 
程 读 出 。 这 是 IPC 中 最 为 有 效 的 一 个 方法 ,因为 所 有 的 通信 并 不 需要 数据 的 传输 。 

此 方法 面向 随机 访问 ,多 个 无 关 进 程 问 可 以 同时 交互 ,但 只 能 在 单机 上 工作 ， 

* Semaphores 

信号 量 是 系统 级 的 变量 ,程序 之 间 可 以 通过 信和 号 量 来 进行 通信 。 进 程 可 以 对 信号 量 做 
增 1 操作, 减 1 操作 或 等 待 信 叶 量 到 某 个 特定 的 值 。 信 和 号 量 类 似 于 许可 证 服务 器 上 的 许可 
证 。 当 进程 需要 使 用 资源 的 时 息 , 它 对 信号 量 做 践 1 操作 ( 取 一 个 许可 证 》。 如 果 此 时 许可 证 
已 经 鹿 帘 了 ,进程 挂 起 直到 其 他 进程 对 信 导 量 做 了 增 1 操作 。 信 号 量 应 用 在 各 种 各 样 的 程 
"nm. 

此 方法 是 面向 消息 的 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 。 

* Message Queues 

消息 队列 的 工作 原理 类 似 于 FIFO, 但 它 并 不 是 以 文件 名 来 标志 。 进 程 可 以 将 消息 加 到 
队列 中 ,然后 由 其 他 进程 将 数据 从 队列 中 取出 。 多 个 队列 可 以 被 多 个 进程 所 共享 。 

这 种 方法 是 面向 消息 的 、. 单 向 传输 的 , 且 只 能 工作 在 单机 上 。 

* Files 

文件 可 以 被 多 个 进程 在 同一 时 刻 打 开 。 如 时 某 进 程 将 数据 写 入 一 个 文件 ,另外 的 进程 
可 以 从 该 文件 中 读 出 数据 。 若 大 家 都 使 用 一 个 经 过 巧妙 设计 的 交互 协议 ,很 多 复杂 的 通信 
都 可 以 通过 市 老 的 文件 机 制 来 实现 ， 

此 方法 面向 随机 访问 ,多 个 无 关 进 程 间 引 以 间 时 交互 ,网 络 文 件 系统 (NFS) 可 以 支持 器 
机 器 的 多 进程 通信 。 


15.7 连接 与 游戏 


本 章 介绍 了 很 多 进程 之 间 传 递 数据 的 方法 。Unix 的 系统 内 核 管理 着 进程 .文件 和 设备 ， 
并 且 对 管道 ,socket .文件 .共享 内 存 以 及 信和 号 进行 操作 使 它们 可 以 传输 数据 。 对 于 某 些 程序 


.第 15 章 进程 间 通 信 (IPC) * 493 * 





来 说 ,创建 和 管理 连接 与 数据 的 传输 是 最 主要 的 部 分 。 
Unix 的 开发 者 之 一 Ken Thompson, Æ 1978 年 写 道 ; 
“与 其 说 Unix 的 内 核 是 一 个 完整 的 操作 系统 ,还 不 如 说 它 是 个 IO 多 路 复 用 器 

(multiplexer) 。 从 这 种 观点 出 发 ,许多 其 他 操作 系统 中 的 特征 在 Unix A B PHRMA BH 

enr ix Vr d d ei E A EAE AR AAEE, 07 
在 第 1 章 中 ,讨论 了 命令 bc. 一 个 Web 服务 器 还 有 一 个 网 络 桥牌 游戏 。 接 着 写 了 一 个 

be 程序 和 痪 个 Web 服务 器 程序 ， 那 么 如 何 写 网 络 桥牌 游戏 呢 ? 可 以 使 用 屏幕 控制 程序 来 

作为 用 户 界面 ,使 用 socket 来 连接 两 端 。 那 么 哪 一 端 是 服务 器 ? 哪 一 端 是 客户 呢 ? 如 何 使 

用 锁 机 制 ? 你 所 需要 的 所 有 的 技术 都 包含 在 本 书 的 章节 中 。 在 Unix 上 进行 编程 并 没有 和 想 

象 中 的 那么 难 , 可 是 也 并 非 是 一 件 容 易 的 事 。 

说 到 游戏 和 网 络 , 让 我 们 回忆 一 下 Dennis Ritchie 是 如 何 来 描述 用 来 引出 Unix 的 空间 
探险 游戏 的 ， 
“最 开始 写 在 Multics 系统 上 …… ,这 并 不 亚 于 对 太阳 系 诸 企 体 运动 的 模拟 。 你 还 必须 

让 玩家 和 铝 驶 着 太空 船 四 处 近视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 呈 星 上 痘 录 .” 

变 驶 着 太空 船 四 处 巡视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 不 就 像 生 活 

中 的 网 络 冲 浪 一 样 吗 ? 可 能 冲浪 并 不 是 最 好 的 比喻 。 但 是 确实 人 们 打开 他 们 的 浏览 器 ,到 

ERRE., Web 服务 器 将 各 处 的 景象 返回 。 人 人 们 使 用 telnet、ssh 还 有 ftp 登录 到 其 他 

机 器 上 。 人 也 许 Internet 恰巧 就 是 Ritchie fl Thompson 在 1969 年 开始 模拟 的 广 阅 空间 的 实 

3i dp ! 
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VEZ RH ERG TA ETER S UEPEIRUUBLEJEXE TC SR Hep X D ETT fe. AS 

BE. AT A HT HY Unix 的 talk 命令 进行 对 话 , 他 们 就 运行 了 两 个 进程 ,将 数据 

从 键盘 和 socket 传输 到 屏幕 和 socket, 

某 些 进程 需要 从 多 个 源 端 接收 数据 ,并 将 数据 送 到 多 个 目的 地 。select 和 poll PH ft 

洗 进 程 等 待 多 个 文件 描述 符 的 输入 。 

Unix 提供 了 许多 方法 来 进行 数据 在 进程 间 传 输 。 命 名 管道 和 共享 内 存 是 同一 机 器 

上 的 进程 间 通 和 信使 用 的 两 种 技术 。 通 信 方 法 的 区 别 在 于 它们 的 速度 、 所 传输 的 消息 

类 型 .所 需 的 范围 .限制 访问 权限 的 能 力 以 及 防止 数据 冲突 的 能 力 。 

。 文件 锁 是 进程 间 使 用 的 避免 对 文件 访问 冲突 的 技术 。 

。 信号 量 是 进程 合作 时 所 使 用 的 系统 级 的 变量 。 进 程 挂 起 等 待 另 一 进程 改变 信号 量 
的 值 。 

2. 下 一 步 做 什么 

FY Unix 系统 编 恰 的 最 好 的 办 法 就 是 不 断 的 读 程 序 , 写 程序 。 大 家 可 以 在 网 上 找到 大 
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,以 及 介绍 Unix 内 部 实现 和 编 穆 接 口 的 书籍 。 大 家 多 注意 一 下 每 天 都 使 用 的 程序 


还 有 一 些 吸 引 你 的 新 程序 。 通 过 使 用 学习, 并 有 旦 经 常 自 己 来 实现 一 些 已 经 存在 的 程序 ,就 








可 以 更 深 、 更 精 、 更 广泛 地 了 人 解 Da wee Ts 
3， 习 题 


15.1 


在 talk 程序 中 ,为 何不 用 线程 从 文件 描述 符 中 读 取 数据 呢 ? "cus 
盘 读 取 数 据 ,而 另 一 线程 从 socket 读 取 数 据 。 若 程 序 由 多 线程 方案 来 实现 ,会 
现 哪些 新 问题 呢 ? 


15.2 talk 程序 在 大 多 数 的 时 候 都 是 在 读 写 单个 字符 ,但 在 传输 数据 的 时 剧 和 使 用 的 是 数 
EA. EHRE socket HRS STA? 

15.3 3 FIFO 的 时 间 上 服务 器 在 执行 到 date > /tmp/time_fifo 的 时 候 挂 起 直到 某 一 
客户 端 打 开 FFO 来 读 取 数据 。 若 服务 器 挂 起 的 附 间 很 长 ,客户 端 是 在 服务 器 挂 
起 时 能 够 接收 到 时 间 还 是 在 服务 器 被 晚 醒 的 时 候 能 接收 到 时 间 ? 为 什么 ? 

15.4 看 一 下 系统 调用 mmap。mmap 将 文件 的 某 一 段 模拟 成 内 在 中 的 一 个 数组 ,从 而 
人 允许 程序 不 使 用 Iseek 就 可 以 对 文件 进行 随机 的 访问 。 使 用 mmap 与 使 用 文件 
或 共享 内 容 的 方式 来 实现 进程 间 通 信和 有 有 何 区 别 ? 和 别 的 方法 相 比 ,使 用 mmap 
MB TR? 

15.5 talk 中 包含 了 两 个 相连 的 进程 。 使 用 -一 下 talk, 看 一 看 连接 是 如 何 建立 的 ? 其 中 
Xf DU eg: EH 

4, 编程 练习 

15.6 参考 sclect 和 poll 调用 的 使 用 手册 ,看 看 你 的 系统 中 是 后 都 支持 。 在 有 些 系统 
中 ,其 中 -- 个 是 真 的 系统 调用 ,而 另外 一 个 则 是 由 那个 真 的 系统 调用 模拟 出 来 
的 。 使 用 poll 来 重 写 程 序 selectdemo., c. 

15.7 编写 使 用 下 列 方法 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 
COD 使 用 IP 地 址 的 数据 报 socket, 
《2) 使 用 Unix 域 地 址 的 流 socket. 

15.8 ”编写 基于 FIFO 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 

15.9 多 个 共享 内 存 的 服务 器 : 


(OD 可 坟 在 同一 时 刻 运 行 两 个 共享 内 存 的 服务 器 吗 ? HIT A? 做 一 下 试验 。 
(2) 修改 服务 器 程序 中 的 wait_and_lock 函数 ， a Ret 
的 服务 器 数 具 变 为 0。 


15. 10 ”在 使 用 文件 的 版 本 中 ,用 文件 锁 来 保护 对 共享 文件 的 访问 。 重 写 此 程序 ,用 信 


15.11 


号 量 来 代 蔡 文件 锁 。 
在 使 用 共享 内 存 的 版 本 中 ,用 信号 量 米 保护 对 共享 内 存 的 访问 。 重 写 此 程序 ， 
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I5. 12 


15. 13 


用 文件 什 来 替代 信和 号 量 。 当 然 这 时 需要 一 个 共享 的 文件 。 

若 用 户 太 多 ,共享 内 存 的 信号 量 解决 方案 就 无 法 报告 正确 的 结果 。 考 虑 一 下 这 
样 的 模式 : 读者 A 将 读者 计数 器 增 至 1。 接 下 来 ,读者 B 将 读者 计数 器 增 至 2。 
这 时 ,读者 A 已 经 读数 据 完毕 ,将 读者 计数 器 减 1, 但 该 者 C 又 将 计数 器 增 1。 
因此 读者 计数 器 这 个 时 候 仍 为 >。 之 后 ,读者 B 结 束 ,A 重 来 ,C HUE MUR B X 
重 来 ……。 因 此 无 论 什么 时 候 , 共 享 内 存 都 在 被 污 取 。 解 释 -- 下 为 什么 这 种 情 
况 阻止 了 写 者 更 新 时 间 。 修 改 此 系统 ,使 得 写 者 可 以 防 正 新 的 读者 锁 住 共享 内 
"B. | 

编写 -- 个 cp 命令 的 新 版 本 打印 机 程序 。 它 使 用 写 数据 锁 来 防止 对 输出 文件 的 
同步 访问 神 突 。 在 你 的 机 器 上 使 用 这 个 程序 同时 打印 两 个 文件 ， 


printep filel /dev/lpl & printcp file2 /dev/lpl& 


